PlAwAnSaI
Administrator
- ประเภทของการเรียนรู้:
- ต้องการพยากรณ์การใช้ไฟฟ้าในอนาคต → Prediction
เนื่องจากเป็นการพยากรณ์แนวโน้มของการใช้ไฟฟ้าในอนาคตจากข้อมูลในอดีต - ต้องการพัฒนาระบบที่สามารถแยกประเภทของ Email เป็น Spam หรือไม่ Spam → Classification
เป็นการจัดประเภทข้อมูล Email ออกเป็นสองกลุ่ม (Spam/ไม่ Spam) - วิเคราะห์ข้อมูลการเคลื่อนที่ของประชากรเพื่ออธิบายพฤติกรรม → Descriptive Inference
เป็นการอธิบายข้อมูลและทำความเข้าใจพฤติกรรมที่เกิดขึ้นจากข้อมูลการเคลื่อนที่ของประชากร - พัฒนาระบบที่ช่วยหาวิธีการขนส่งสินค้าที่มีต้นทุนต่ำที่สุด → Optimization
เป็นการหาวิธีที่มีประสิทธิภาพสูงสุดในการขนส่งสินค้าเพื่อลดต้นทุน
.
- ต้องการพยากรณ์การใช้ไฟฟ้าในอนาคต → Prediction
- ชนิดของข้อมูลที่สามารถนำไปสร้างเป็นภาพได้:
- UINT8 (Unsigned Integer 8-bit)
ใช้กันทั่วไปในการเก็บค่า Pixel ของภาพ (0-255) ในภาพแบบ Grayscale และ RGB - Float64 (64-bit Floating Point)
ใช้แทนค่าตัวเลขที่มีทศนิยม แม้ไม่ใช่รูปแบบทั่วไปของภาพ แต่สามารถใช้เก็บค่า Pixel ที่เป็น Normalized Values (เช่น 0.0 ถึง 1.0) - Float32 (32-bit Floating Point)
เช่นเดียวกับ Float64 มักใช้ในการประมวลผลภาพแบบ Deep Learning หรือ Graphic Computer
.
- UINT8 (Unsigned Integer 8-bit)
- อุปกรณ์สำหรับใช้ในการพัฒนา IoT:
- ESP8266: เป็น Module Wi-Fi ราคาถูกที่ได้รับความนิยมในการพัฒนา IoT
- Arduino Board: Board Micro Controller ยอดนิยมที่ใช้พัฒนาอุปกรณ์ IoT
- Raspberry Pi: Computer ขนาดเล็กที่ใช้กันมากในโครงการ IoT
.
- ค่า WER (Word Error Rate) ตามสูตรที่กำหนด: 𝑊𝐸𝑅 = (𝑆 + 𝐼 + 𝐷) / 𝑁
ข้อมูลที่กำหนด:
Target Tokens: ["ชอบ", "กิน", "ไก่ทอด", "และ", "ส้มตำ"]
Generated Tokens: ["ชอบ", "กิน", "กลิ่น", "ไก่ทอด", "ส้มตำ", "มา"]
วิเคราะห์ความผิดพลาด:
S (Substitutions - คำที่แทนที่กัน) "กลิ่น" ถูกแทนที่ "ไก่ทอด" (1 คำ)
D (Deletions - คำที่หายไป) "และ" หายไป (1 คำ)
I (Insertions - คำที่เพิ่มเข้ามา) "มา" ถูกเพิ่มเข้ามา (1 คำ)
N (จำนวนคำใน Target Sentence) ["ชอบ", "กิน", "ไก่ทอด", "และ", "ส้มตำ"] → 5 คำ
แทนค่าลงในสูตร:= (1+1+1) / 5 = 3/5
- นิพจน์ (P → Q) ∧ (Q → P) หมายถึง P และ Q มีค่าความจริงเหมือนกันเสมอ
นี่คือความหมายของ "การเชื่อมโดยสมมูล" (Biconditional) ซึ่งเขียนแทนด้วย P ⟷ Q
- Unsupervised Learning เป็น Technique การเรียนรู้ของเครื่องที่ไม่ต้องการ Label ในข้อมูล Input ในการฝึก
- การคำนวณจาก ตำแหน่ง End-effector ของแขนกลหุ่นยนต์ เพื่อหามุมองศาการเคลื่อนที่ของ แต่ละจุดหมุน (Angle of Joint) เป็นปัญหา Inverse Kinematics (IK)
Inverse Kinematics (IK): ใช้คำนวณมุมของข้อต่อเพื่อให้ End-effector ไปยังตำแหน่งที่ต้องการ
Direct Kinematics (DK): ใช้หาตำแหน่งของ End-effector จากมุมของข้อต่อ (ตรงข้ามกับ IK)
- หากมีข้อมูลเสียงจำนวนน้อย การรู้จำเสียงพูดด้วย HMM จะให้ประสิทธิภาพดีกว่าแบบจำลอง DNN แบบทั่วไป เพราะ HMM (Hidden Markov Model) ใช้ข้อมูลที่มีโครงสร้างชัดเจนและทำงานได้ดีเมื่อข้อมูลมีขนาดเล็ก ขณะที่ DNN (Deep Neural Network) ต้องการข้อมูลจำนวนมาก
การรู้จำเสียงพูดแบบจำลอง DNN จะต้องอาศัยคลังข้อมูลจำนวนมากจึงจะได้แบบจำลองมีประสิทธิภาพ เพราะ DNN ต้องการข้อมูลขนาดใหญ่เพื่อเรียนรู้รูปแบบเสียงพูดอย่างมีประสิทธิภาพ
ในกรณีทั่วไป HMM เร็วกว่า DNN เพราะมีโครงสร้างที่ง่ายกว่า แต่ให้ความแม่นยำน้อยกว่าเมื่อเทียบกับ DNN บนข้อมูลขนาดใหญ่
หากมีข้อมูลขนาดใหญ่มากๆ เช่น 1,000 ชั่วโมง แบบจำลอง DNN จะให้ประสิทธิภาพดีกว่าแบบจำลอง HMM เพราะ DNN สามารถเรียนรู้คุณลักษณะเชิงลึกจากข้อมูลจำนวนมาก ทำให้แม่นยำกว่า HMM
- เครือข่ายประสาทเทียม (Neural Network) เป็น Technique การเรียนรู้เชิงลึกที่ทรงพลัง เหมาะอย่างยิ่งสำหรับงานที่เกี่ยวข้องกับการรู้จำรูปแบบและการจำแนกประเภท เช่น การรู้จำและจำแนกตัวเลขที่เขียนด้วยมือจากภาพ เครือข่ายประสาทเทียมได้รับแรงบันดาลใจมาจากเครือข่ายประสาทชีวภาพในสมองมนุษย์
- ระบบ AI ที่มีปฏิสัมพันธ์กับสภาพแวดล้อมที่เปลี่ยนแปลงตลอดเวลาและต้องเรียนรู้การกระทำที่เหมาะสมที่สุดโดยอาศัยการเรียนรู้แบบ Reinforcement ตัวอย่างเช่น ระบบ Self-driving Car อาจได้รับรางวัลเชิงบวกสำหรับการขับขี่ที่ปลอดภัยและมีประสิทธิภาพ และได้รับบทลงโทษเชิงลบสำหรับการชนหรือการละเมิดกฎจราจร
- Embedding มีบทบาทสำคัญในการแสดงและทำความเข้าใจความหมายของคำและภาษา, Model ภาษาขนาดใหญ่ (LLMs) มักได้รับการฝึกฝนบนข้อมูลข้อความจำนวนมหาศาล และ Embedding ถูกใช้เพื่อแสดงคำหรือ Token ในข้อมูลนี้ในรูปแบบของ Vector เชิงตัวเลข
- Fine-tuning คือกระบวนการปรับแต่ง Model ภาษาที่ผ่านการฝึกฝนมาก่อนแล้ว เพื่อให้สามารถทำงานเฉพาะทางได้ โดยการฝึกฝนเพิ่มเติมบนข้อมูลที่มีการติดฉลาก (Label) สำหรับงานเหล่านั้น
- Multimodal Model ถูกออกแบบมาเป็นพิเศษเพื่อรองรับข้อมูลนำเข้าจากหลายรูปแบบ เช่น ข้อความ ภาพ เสียง และ VDO, Model เหล่านี้สามารถผสมผสานและประมวลผลข้อมูลจากแหล่งข้อมูลนำเข้าที่แตกต่างกันได้
- Amazon Comprehend เป็นบริการประมวลผลภาษาธรรมชาติ (Natural Language) ที่สามารถวิเคราะห์ข้อความและดึงข้อมูลเชิงลึกต่างๆ เช่น ความรู้สึก, Entity, วลีสำคัญ (Key Phrase) และหัวข้อ (Topic)
- Amazon SageMaker เป็นบริการที่มีการจัดการอย่างเต็มรูปแบบ (Fully Managed) ซึ่งให้บริการ Machine Learning Lifecycle อย่างครบถ้วน รวมถึงการเตรียมข้อมูล การสร้าง Model การฝึกสอน (Training), การปรับแต่ง (Tuning), และการ Deploy
- การประมวลผลเอกสารอัจฉริยะ (Intelligent Document Processing/IDP) คือรูปแบบการใช้งานที่ดึงและจำแนกข้อมูลสารสนเทศจากข้อมูลที่ไม่มีโครงสร้างหรือที่มีโครงสร้าง สร้างสรุปความ และแสดงข้อมูลเชิงลึกที่นำไปดำเนินการได้จริง
การจดจำใบหน้า คือ Software ที่ระบุหรือยืนยันตัวตนของบุคคลโดยใช้ใบหน้า
Computer Vision คือรูปแบบการใช้งาน AI ที่เกี่ยวข้องกับการวิเคราะห์และทำความเข้าใจภาพและ VDO Digital
การตรวจจับการหลอกลวง คือรูปแบบการใช้งาน AI ที่ระบุและป้องกันกิจกรรมที่เป็นการหลอกลวง เช่น การฉ้อโกงบัตร Credit หรือภัยคุกคามการรักษาความปลอดภัยทาง Cyber
- การใช้ Algorithm ของ Computer Vision และ Machine Learning (ML) เพื่อตรวจสอบการควบคุมคุณภาพบนสายการผลิตโดยอัตโนมัติ เป็นการนำ Technology AI/ML ไปใช้ได้เหมาะสม โดยวิธีนี้ใช้ระบบ AI/ML เพื่อตรวจจับรูปแบบและความผิดปกติ จึงตรวจสอบคุณภาพได้อย่างสม่ำเสมอและปรับขนาดได้ ซึ่งก็จะช่วยปรับปรุงคุณภาพของผลิตภัณฑ์และลดความจำเป็นในการตรวจสอบด้วยตนเองได้ในท้ายที่สุด
- Technique ของ ML:
- การถดถอย ใช้แก้ปัญหาที่ต้องอาศัยการคาดการณ์ค่าตัวเลขแบบต่อเนื่อง (เช่น คาดการณ์ราคาขายบ้าน)
- การจำแนกประเภทเป็น Technique การเรียนรู้แบบมีผู้ดูแลที่ใช้กำหนดประเภทหรือหมวดหมู่ให้กับ Instance ข้อมูลใหม่ที่ยังไม่เคยเห็น โดยอิงตาม Model ที่ผ่านการฝึกมาแล้ว
- การแบ่งกลุ่ม Cluster จัดกลุ่มข้อมูลเป็น Cluster ต่างๆ ตามคุณสมบัติที่คล้ายกันหรือระยะห่างระหว่างจุดข้อมูล เพื่อให้เข้าใจคุณลักษณะของ Cluster เฉพาะได้ดีขึ้น
- การลดมิติข้อมูลเป็น Technique การเรียนรู้แบบไม่มีผู้ดูแลที่ใช้เพื่อลดจำนวนคุณสมบัติหรือมิติในชุดข้อมูลหนึ่ง โดยที่ยังคงข้อมูลหรือรูปแบบที่สำคัญที่สุดไว้ตามเดิม
.
- ความสามารถส่วนหนึ่งของระบบ Generative AI สำหรับการใช้งานทางธุรกิจ:
- การปรับให้เหมาะกับแต่ละบุคคล: Generative AI สามารถสร้างเนื้อหาเฉพาะบุคคลที่ปรับให้เหมาะกับความต้องการหรือลักษณะเฉพาะของแต่ละบุคคล ซึ่งช่วยปรับปรุงประสบการณ์และการมีส่วนร่วมของผู้ใช้ให้ดียิ่งขึ้น
- ความสามารถในการปรับขนาด: เมื่อผ่านการฝึกมาแล้ว Model Generative AI จะสามารถสร้างเนื้อหาจำนวนมากได้อย่างรวดเร็ว ทำให้ Model นี้เหมาะสำหรับงานที่ต้องผลิตเนื้อหาปริมาณมาก
- ความง่ายในการใช้งาน: Generative AI ทำให้งานที่ซับซ้อนง่ายขึ้นได้ ด้วยการทำให้กระบวนการสร้างเนื้อหาดำเนินไปเองอัตโนมัติ ตัวอย่างเช่น Model ภาษา AI สามารถสร้างข้อความที่เหมือนกับสร้างด้วยมนุษย์ ซึ่งจะลดเวลาและภาระงานที่จำเป็นสำหรับการสร้างเนื้อหาให้น้อยลง
.
- ความท้าทายของ Generative AI:
- ความไม่แน่นอนเป็นความท้าทายที่ Model สร้าง Output ที่ต่างไปจากเดิมทุกครั้งที่ Run จากข้อมูล Input เดียวกัน
- ความไม่เหมาะสมเกิดขึ้นเมื่อ Model สร้างเนื้อหาที่กระตุ้นโทสะ สร้างความขุ่นเคือง หรือไม่เหมาะสม
- ความเสี่ยงทางสังคมเกิดขึ้นเมื่อ Model สร้างเนื้อหาไม่พึงประสงค์ที่อาจส่งผลเสียต่อองค์กร
- ผลลัพธ์เพี้ยนเกิดขึ้นเมื่อ Model สร้างผลคำตอบที่ไม่ถูกต้อง ไม่สอดคล้องกับข้อมูลสำหรับฝึก
.
- ตัวชี้วัดทางธุรกิจที่เหมาะสำหรับการประเมินประสิทธิภาพของระบบสนับสนุนลูกค้า คือความพึงพอใจของลูกค้าซึ่งเป็นตัวชี้วัดที่สำคัญสำหรับการประเมินประสิทธิภาพของระบบ เนื่องจากจะวัดโดยตรงว่าระบบตอบสนองความต้องการและตรงตามความคาดหวังของลูกค้าเพียงใด
ประสิทธิภาพข้ามกลุ่มธุรกิจมีความเกี่ยวข้องกับระบบสนับสนุนลูกค้าน้อยกว่า เพราะจะมุ่งเน้นที่สินค้าหรือบริการเฉพาะ
รายได้เฉลี่ยต่อผู้ใช้เป็นการวัดจำนวนเงินเฉลี่ยที่ได้รับจากลูกค้าแต่ละราย
อัตราการ Conversion เหมาะจะใช้กับโครงการริเริ่มด้านการขายและการตลาดมากกว่าการสนับสนุนลูกค้า
Last edited: