hitexts

Hi, We texts to you.

เทคนิคของ ML แบบ Generative

สำหรับประเภทการเรียนรู้ของ Machine Learning นั้นคงเริ่มเป็นที่ทราบกันดีแล้วว่ามี 3 รูปแบบใหญ่ ๆ คือ Supervised Learning, Unsupervised Learning, และ Reinforcement Learning โดยสามารถอ่านรายละเอียดเพิ่มเติมได้ที่นี่ [1] 
[2] แต่ในบทความนี้จะพามารู้จักกับประเภทเทคนิคของ ML ที่ถูกใช้เพื่อให้เกิดการเรียนรู้ โดยแบบแรกคือ Generative Models จะเริ่มต้นเรียนรู้จากความน่าจะเป็นของการกระจายตัวของข้อมูลก่อนว่าข้อมูลมีลักษณะเป็นอย่างไรบ้างโดยใช้
Joint Proability Distribution และเมื่อเข้าใจว่าข้อมูลกระจายตัวอย่างไรแล้วจึงทำการทำนาย Posterior Proability โดยใช้กฎของ Bayes มาคำนวณ

คุณสมบัติสำคัญของการเรียนรู้แบบ Generative คือ

  • เรียนรู้การที่จะสร้างข้อมูล และสามารถที่จะสร้างตัวอย่างของข้อมูลขึ้นมาใหม่ได้
  • เรียนรู้โดยใช้ Joint Probability Distribution P(Y), P(X|Y)
  • สร้าง Decision Boubdary เพื่อจำแนกประเภทของข้อมูล (แต่ต่างกันกับ Discriminative ตรงที่หลักความน่าจะเป็นที่ใช้)

ตัวอย่างโมเดล Generative Classifier

  • Naive Bayes
  • Bayesian Networks
  • Markov random fields
  • Hidden Markov Models (HMM)

ข้อดี

  • เหมาะกับการเรียนรู้แบบ Unsupervised Learning
  • สามารถทำความเข้าใจเบื้องต้นได้ว่าข้อมูลบนคลาสนั้น ๆ ถูกสร้างอย่างไร

ข้อเสีย

  • จำเป็นต้องใช้ข้อมูลมากและทำให้ต้นทุนในการเรียนรู้และคำนวณสูงตามไปด้วย

เทคนิคของ ML แบบ Discriminative

Discriminative Models จะทำนาย Posterior Probability และสร้าง Decision Boundary เพื่อจำแนกข้อมูลเช่นกันเพียงแต่ว่าโมเดลประเภทนี้จะทำการเรียนรู้และสร้างโมเดลโดยทันทีไม่ได้สนใจว่าข้อมูลจะถูกสร้างขึ้นได้อย่างไร
(จำแนกประเภทอย่างเดียว)

คุณสมบัติสำคัญของการเรียนรู้แบบ Discriminative คือ

  • เรียนรู้ด้วย conditional probability distribution P(Y|X)
  • สร้าง Decision Boundary โดยตรงจาก Training Data โดยใช้ความน่าจะเป็นตามข้างต้น

ตัวอย่างโมเดล Generative Classifier

  • Logistic Regression
  • SVM
  • Traditional Neural Networks
  • KNN

ข้อดี

  • ใช้ข้อมูลในการเรียนรู้น้อยกว่าแบบ Generative จึงทำให้ต้นทุนการเรียนรู้ถูกกว่า
  • มีการใช้งานกันอย่างกว้างขวาง

ข้อเสีย

  • เรียนรู้ด้าน Unsupervised Learning ได้ไม่ดีนัก
  • อาจยากต่อการอธิบายหรือตีความว่ามันแยกแยะข้อมูลได้อย่างไร

Conclusion

ในเทคนิคทั้งสองประเภทนี้เรียนรู้ที่จะจำแนกข้อมูลด้วยการสร้าง Decision Boundary ขึ้นมาเหมือนกันเพียงแต่ว่าต่างกันที่ความน่าจะเป็นที่ใช้และการให้ความสนใจกับการสร้างข้อมูลตัวอย่างขึ้นมาก่อนหรือไม่ ทั้งนี้จะเลือกใช้แบบไหนก็ขึ้นอยู่กับงานที่ต้องทำเพราะทั้งสองแบบก็วัตถุประสงค์ที่แตกต่างกันและความสามารถที่แตกต่างกัน

ที่มา และอ่านเพิ่มเติม

Generative & Discriminative Models 1

Generative & Discriminative Models 2

Joint Probability & Conditional Probability

Related Post

Metadata คืออะไร บอกอะไรเกี่ยวกับชุดข้อมูลนั้น ๆ บ้าง
25Sep

Metadata คืออะไร บอกอะไรเกี่ยวกับชุดข้อมูลนั้น ๆ บ้าง

Metadata คือข้อมูลที่อธิบายชุดข้อมูล เพื่อให้เข้าใจได้เบื้องต้นว่าเป็นชุดข้อมูลเกี่ยวกับอะไร ประเภทไฟล์ วันที่สร้างและปรับปรุง

Mutual Information ขั้นตอนแรกที่แนะนำให้ทำตอนเริ่มโปรเจค ML
05Aug

Mutual Information ขั้นตอนแรกที่แนะนำให้ทำตอนเริ่มโปรเจค ML

การทำงานด้าน Machine Learning นั้นจะต้องเจอข้อมูลและมีคำถามเสมอว่าควรเริ่มจากอะไรดี โดย Mutual Information เป็นหนึ่งในขั้นตอนที่แนะนำให้ทำ

One Hot Encoding วิธีแปลงข้อมูลประเภท Category เพื่อใช้เทรนโมเดล
01Aug

One Hot Encoding วิธีแปลงข้อมูลประเภท Category เพื่อใช้เทรนโมเดล

วิธีการแปลงข้อมูลประเภทหมวดหมู่/ประเภท (ที่เป็นตัวอักษร) ให้เป็นชุดตัวเลขด้วยวิธีการ One Hot Encoding เพื่อให้โมเดลสามารถเรียนรู้ได้

ANN (Artificial Neural Network) พื้นฐานของ Deep Learning
22Jul

ANN (Artificial Neural Network) พื้นฐานของ Deep Learning

การเรียนรู้เชิงลึก (Deep Learning) นั้นเป็นเทคนิคที่มัประสิทธิภาพมากในงาน Machine Learning ปัจจุบันซึ่งเบื้องหลังของมันก็คือการใช้ ANN

Parsing Dates การจัดการกับข้อมูลวันที่ในชุดข้อมูลด้วย Pandas
04Jul

Parsing Dates การจัดการกับข้อมูลวันที่ในชุดข้อมูลด้วย Pandas

ในหลาย ๆ ชุดข้อมูลมักจะมีการเก็บวันที่ไว้ด้วยเสมอ ซึ่งการ Parsing Dates จะช่วยให้ใช้งานวันที่เหล่านั้นได้ง่ายยิ่งขึ้น

Data source แหล่งชุดข้อมูลสำหรับใช้ทำงานด้านข้อมูลช่วยให้โปรเจคราบรื่นยิ่งขึ้น
01Jul

Data source แหล่งชุดข้อมูลสำหรับใช้ทำงานด้านข้อมูลช่วยให้โปรเจคราบรื่นยิ่งขึ้น

การจะเริ่มทำโปรเจคอะไรสักอย่างสิ่งที่ขาดไม่ได้เลยคือข้อมูล แล้วยิ่งเป็นงานที่เกี่ยวข้องกับ Data แล้วนั้น Data source จึงเป็นสิ่งจำเป็นมาก

© 2022 hitexts. All rights reserved