ทดสอบคำสั่ง WordCloud ของ Wolfram Mathematica กับภาษาไทย

Wolfram Mathematica มีคำสั่ง WordCloud ที่จะช่วยสร้างเมฆของกลุ่มคำที่มีการใช้บ่อยๆจากข้อความที่เราใส่เข้าไป โดยที่คำที่มีการใช้บ่อยที่สุดจะมีตัวโตที่สุด และขนาดของคำอื่นก็ลดลงตามความถี่ของการใช้หรือตามความถี่ทีีปรากฏในข้อความที่เราใส่เข้าไป

ตัวอย่างเช่นที่ http://blog.wolfram.com/2015/09/18/the-republican-presidential-debate-clouds-round-2/ แสดงคำพูดที่ผู้สมัครลงชิงตำแหน่งประธานาธิบดีของพรรครีพับบริกันพูดดีเบตกัน

cloud1

คำสั่ง WordCloud นี้ใช้ได้ดีกับภาษาอังกฤษครับ ไม่มีอะไรมาก เพียงcopyมาใส่ใน Mathematica ได้เลย เพราะ Mathematica จะรู้วิธีการแบ่งคำภาษาอังกฤษอยู่แล้ว แต่ถ้าจะใช้กับภาษาไทยเราต้องทำการแบ่งเว้นวรรคแต่ล่ะคำมาเองก่อนถึงจะใช้ได้ครับ ในตัวอย่างนี้ผมลองใช้บริการตัดคำ(แบ่งคำ)ภาษาไทยเราจากเวบ http://www.sansarn.com/lexto/ ครับ ซึ่งผลที่ได้ก็โอเคครับ