Metadata คืออะไร บอกอะไรเกี่ยวกับชุดข้อมูลนั้น ๆ บ้าง
Metadata คือข้อมูลที่อธิบายชุดข้อมูล เพื่อให้เข้าใจได้เบื้องต้นว่าเป็นชุดข้อมูลเกี่ยวกับอะไร ประเภทไฟล์ วันที่สร้างและปรับปรุง
Artificial Neural Network หรือชื่อภาษาไทยคือโครงข่ายประสาทเทียมซึ่งสิ่งนี้ได้แรงบันดาลใจมาจากระบบประสาทของสิ่งมีชีวิตมาเป็นแบบอย่างในระบบการทำงาน (แบ่งเป็น Node และแต่ละ Node สามารถที่จะรับ ประมวลผล และส่งข้อมูลได้) โดย ANN นี้เป็นหัวใจสำคัญของการทำ Deep Learning (ถ้าแบบง่าย ๆ DL ก็คือ ANN ที่มีหลาย Layers) และเทคนิคที่ใช้ Neuron Network เรียกได้สามารถทำได้หลากหลายงานใน Machine Learning ไม่ว่าจะมีสเกลที่ใหญ่หรือยากซับซ้อนแค่ไหนถือว่าเป็น State of the art สำหรับหลาย ๆ ปัญหาในปัจจุบัน (โดยเฉพาะด้าน Vision และ NLP)
ขึ้นชื่อว่าโครงข่ายประสาทเทียมแน่นอนว่าต้องประกอบไปด้วยตัวรับรู้ ซึ่งเรียกกันว่า Perceptron โดย
ชื่อ Layers ที่ควรรู้
สรุปง่าย ๆ ว่า ANN ประกอบด้วย Perceptron และ Perceptron ก็คือ neurons จำนวน 1 Layer ซึ่งสามารถนำไปใช้ในงาน Linear Binary Classification ได้ หาก ANN มีหลาย Layers จะเรียกว่าเป็น Deep Learning ซึ่งสามารถนำไปใช้แก้ปัญหาได้สารพัดอย่าง หากต้องการรู้เพิ่มเติมสามารถอ่านได้ที่นี่
Metadata คือข้อมูลที่อธิบายชุดข้อมูล เพื่อให้เข้าใจได้เบื้องต้นว่าเป็นชุดข้อมูลเกี่ยวกับอะไร ประเภทไฟล์ วันที่สร้างและปรับปรุง
การทำงานด้าน Machine Learning นั้นจะต้องเจอข้อมูลและมีคำถามเสมอว่าควรเริ่มจากอะไรดี โดย Mutual Information เป็นหนึ่งในขั้นตอนที่แนะนำให้ทำ
วิธีการแปลงข้อมูลประเภทหมวดหมู่/ประเภท (ที่เป็นตัวอักษร) ให้เป็นชุดตัวเลขด้วยวิธีการ One Hot Encoding เพื่อให้โมเดลสามารถเรียนรู้ได้
การเรียนรู้เชิงลึก (Deep Learning) นั้นเป็นเทคนิคที่มัประสิทธิภาพมากในงาน Machine Learning ปัจจุบันซึ่งเบื้องหลังของมันก็คือการใช้ ANN
ในหลาย ๆ ชุดข้อมูลมักจะมีการเก็บวันที่ไว้ด้วยเสมอ ซึ่งการ Parsing Dates จะช่วยให้ใช้งานวันที่เหล่านั้นได้ง่ายยิ่งขึ้น
การจะเริ่มทำโปรเจคอะไรสักอย่างสิ่งที่ขาดไม่ได้เลยคือข้อมูล แล้วยิ่งเป็นงานที่เกี่ยวข้องกับ Data แล้วนั้น Data source จึงเป็นสิ่งจำเป็นมาก