BEST2010 เปิดให้ทดสอบโปรแกรมของท่าน

BEST2010 เปิดให้ท่านทดสอบโปรแกรมแบ่งคำภาษาไทยของท่านได้ที่นี้ >> Test Program <<

BEST2010 : การแข่งขันสุดยอดซอฟต์แวร์แบ่งคำภาษาไทย


การวัดเปรียบเทียบสมรรถนะเพื่อพัฒนามาตรฐานการประมวลผลภาษาไทย (Benchmark for Enhancing the Standard of Thai language processing) หรือ BEST นี้ เป็นชุดของการแข่งขันซอฟต์แวร์ที่สำคัญและเกี่ยวข้องกับการประมวลผลภาษาไทย โดยแต่ละปีจะมีการกำหนดหัวข้อการแข่งขันตามความเหมาะสม ทั้งนี้ เพื่อให้ครอบคลุมเนื้อหาในการประมวลผลภาษาไทยระดับต่างๆ

 

หัวข้อการแข่งขันประจำปี 2010
------------------------------------------
สำหรับ BEST ในปีที่สองนี้จะยังคงหัวข้อ การแบ่งคำไทย (Thai Word Segmentation) ซึ่งเป็นพื้นฐานสำคัญและจำเป็นที่สุดสำหรับการเริ่มต้นประมวลผลภาษาไทย เหตุเพราะเราเขียนภาษาไทยโดยไม่มีการกำหนดขอบเขตของคำ จึงประมวลผลได้ยาก และถ้าแบ่งคำผิดตั้งแต่แรก การประมวลผลที่ตามมาก็จะผิดพลาดไปด้วยอย่างหลีกเลี่ยงมิได้ ตัวอย่างเช่น ประโยค “ฉันมารอกราบพระสงฆ์” สามารถแบ่งคำได้เป็น ฉัน|มาร|อก|ราบ|พระสงฆ์| หรือ ฉัน|มา|รอก|ราบ|พระสงฆ์| หรือ ฉัน|มา|รอ|กราบ|พระสงฆ์| โดยแบบสุดท้ายเป็นแบบที่ถูกต้องที่สุด

 

แหล่งรวบรวมความรู้


แหล่งรวบรวมความรู้

กรุณาแจ้งให้เราทราบถ้าท่านรู้จักแหล่งผลงานหรือสิ่งพิมพ์อื่นๆที่น่าสนใจ เพื่อเป็นประโยชน์แก่ทุกๆคน

เอกสารแนวทางการแบ่งคำไทยและคลังข้อความขนาดใหญ่
----------------------------------------------------------------------
ทุก คนสามารถดาวน์โหลดเอกสารแนวทางการแบ่งคำไทยและคลังข้อความขนาดใหญ่ที่แบ่งคำ ไว้แล้วขนาดประมาณ 5 ล้านคำ เพื่อการฝึกฝนระบบ โดยจะทยอยเปิดให้ดาวน์โหลดตั้งแต่เดือนกรกฎาคม – ธันวาคม 2551 เพียงลงทะเบียนง่ายๆ และไม่เสียค่าใช้จ่ายใดๆ

สามารถดาวน์โหลดได้ที่ http://thailang.nectec.or.th/2009

 

หอเกียรติยศ (Hall of Fame)


>>เยี่ยมชมหอเกียรติยศ (Hall of Fame)<<
หมวดรางวัลพิเศษ

  • รางวัล Best of the BEST : "แบบจำลองผสมแบบแยกแยะสำหรับการแบ่งคำไทย" พัฒนาโดย นายฆนาศัย กรึงไกร นางสาวชุลีรัตน์ จรัสกุลชัย และ Mr.Kazama Junichi
  • รางวัล Student BEST อันดับที่ 1 : "ซีพีเอสเคคัท" พัฒนาโดย นายกฤตธี ศิริสิทธ์ และนายณัฏ ปิยะปราโมทย์ จากมหาวิทยาลัยเกษตรศาสตร์ โดยมี อาจารย์ชัยพร ใจแก้ว เป็นที่ปรึกษา
  • รางวัล Student BEST อันดับที่ 2 : (ไม่มีผู้ได้รับรางวัล)
Syndicate content