OpenThaiGPT
  • 🏠ยินดีต้อนรับสู่ OpenThaiGPT 1.6 และ OpenThaiGPT R1
  • 📚OpenThaiRAG
  • 🎇Web Demo!
  • ▶️Colab Demo!
  • 🔥OpenThaiGPT 1.0.0 <8 Apr 2024>
  • ❤️องค์กรที่ร่วมสนับสนุน (Sponsors)
  • 🤟ทีมอาสาสมัคร (Volunteer)
  • กฎกติกาความร่วมมือ (Rules)
  • ร่วมกับเรา (Join Us)
  • License
  • Previous Versions and Resources
    • 💻Released Code / Colabs
      • Pretraining LLM
      • 🆕InstructGPT Finetuning
      • Reinforcement Learning with Human Feedback (RLHF)
    • 😍การช่วยกันสร้าง Dataset สนทนา Chat ภาษาไทย!
    • 📄Released Datasets (14/04/23)
    • 📦Released OpenThaiGPT Pip Python Library <0.1.1> (26/05/23)
    • 🔥Released OpenThaiGPT 7b <1.0.0-beta> (16/08/23)
    • 🔥Released OpenThaiGPT 13b <1.0.0-beta> (20/12/23)
    • แผนการดำเนินงาน Roadmap
    • Open Resources
      • 🆕Free Working Datasets
      • Related Paper / Knowledge
      • Computing Resources
    • Previous Events
      • 🥳OpenThaiGPT Meet Up #2
      • 🆕อัพเดท! จากทีม Finetune (8 Apr)
      • Core-team Volunteer Meeting 19 March 15:30
      • Finetuning / RLHF Volunteer Event (18 March)
      • Safety Net Volunteer Event (12 March 19:00-19:45)
      • Pre-training Volunteer Event (11 March 19:00-20:15)
      • Volunteer Meetup #1 (Zoom) 5 March 13:00
      • First Meet Up (25 Feb 2023)!
      • 🔥Released Models Version <0.1.0-beta> (16/05/23)
      • 🔥Released Models Version <1.0.0-alpha> (03/08/23)
    • ChatGPT สร้างขึ้นมาได้อย่างไร (How to build ChatGPT?)
    • OpenThaiGPT Version 1.0
    • OpenThaiGPT 1.5
Powered by GitBook
On this page
  • เว็บไซด์ที่ร่วมกันสร้าง Dataset สนทนา Chat ภาษาไทย
  • Q/A

Was this helpful?

Export as PDF
  1. Previous Versions and Resources

การช่วยกันสร้าง Dataset สนทนา Chat ภาษาไทย!

PreviousReinforcement Learning with Human Feedback (RLHF)NextReleased Datasets (14/04/23)

Last updated 2 years ago

Was this helpful?

เว็บไซด์ที่ร่วมกันสร้าง Dataset สนทนา Chat ภาษาไทย

Q/A

Q: ทำไมถึงเลือก Fork จากเว็บไซด์ของ Open Assistant และทำการ Host เอง ทำไมเราถึงไม่พัฒนาเอง หรือไม่ไปใช้ของ Open Assistant โดยตรงเลย? A: มีข้อดีหลายอย่างที่เลือกในการ Fork จากเว็บไซด์ Open Assistant

(1) ไม่เสียเวลาในการพัฒนาเอง (2) ได้รับ Update แก้ไข Bug จากทาง Open Assistant อยู่เสมอ (3) ผู้พัฒนา OpenThaiGPT ได้รับ Dataset ดิบทันที เมื่อมีคนมาสร้าง Dataset บนเว็บไซด์ ไม่ต้องรอให้ทาง Open Assistant ปล่อยข้อมูล (4) สามารถนำ Dataset จาก OpenThaiGPT ส่งต่อให้ทาง Open Assistant ได้โดยง่าย เนื่องจากสร้างมาจากระบบเดียวกัน (5) ได้ Pipeline และ Guideline ในการจัดทำ Dataset ที่เป็นมาตรฐานระดับโลก (6) เนื่องจากว่าเรา Focus ภาษาไทยภาษาเดียว ทำให้เราสามารถปล่อย Dataset ได้ถี่ขึ้น (ทุกวันอาทิตย์ของสัปดาห์) (7) สามารถขยายต่อยอดในงาน Tag ข้อมูลอื่นๆ ที่ทาง OpenThaiGPT อาจจะต้องใช้ในอนาคต หรือสามารถแก้ไขปรับปรุงระบบให้สนับสนุนภาษาในภูมิภาค South-east Asia อื่นๆ อาทิเช่น CLMV ได้ไวกว่า

----

เพื่อให้ทีมงาน OpenThaiGPT ได้รับ Dataset สำหรับในการพัฒนา Thai InstructGPT และ Reward Model (RM) ให้ได้เร็วที่สุด ทางทีมงานเลยพัฒนาเว็บไซด์ที่ใช้ร่วมกันสร้าง Dataset นี้โดยทำการ Fork มาจาก Website ที่เปิด Opensource ภายใตัอนุสัญญา Apache 2.0

Q: เว็บไซด์สร้าง Dataset ของ OpenThaiGPT เปิด Source code หรือไม่ A: เราเปิด Source code เว็บไซด์สร้าง Dataset ของ OpenThaiGPT ภายใตัอนุสัญญา Apache 2.0 ที่

😍
https://github.com/LAION-AI/Open-Assistant
https://github.com/OpenThaiGPT/Open-Assistant
https://tag.openthaigpt.aieat.or.th/
OpenThaiGPT
https://tag.openthaigpt.aieat.or.th/
Logo