การใช้งาน Google Vision
Last updated
Last updated
🌟 ภาพตัวอย่างการใช้ Google Vision อ่านป้ายทะเบียนรถ
😲 ผลลัพธ์ที่ได้จาก Google Vision
จากภาพตัวอย่าง ในส่วนเรื่องความแม่นยำจะเห็นว่า ตัวอักษร 'ง' ถูกสะกดเป็น 'ม' จะไม่แม่นยำ 100% แต่ทั้งนี้ความแม่นยำจะขึ้นอยู่กับ font ที่เลือกใช้ หรือความชัดของรูปภาพด้วยนั่นเอง ทั้งนี้เราอาจจะเก็บทั้งรูปภาพ และให้ Google Vision แกะตัวอักษรควบคู่ก็ได้เช่นกัน เพื่อใช้ตรวจสอบภายหลัง
ก่อนอื่นเรามาทำความรู้จักกับ Google Vision เบื้องต้นกันเถอะ Google Vision เป็นบริการจากทาง Google ที่มี API ให้ใช้งานทางด้าน Machine Learning (ML) โดยจะมีทั้งเอกสาร และโค้ดตัวอย่างของภาษาโปรแกรมมิ่ง เช่น C#, GO, Java, Node.js, PHP, Python, Ruby เรียกได้ว่า Google ยกตัวอย่างภาษาโปรแกรมมิ่งยอดนิยมมาให้ใช้กันเลยทีเดียว
ในบทความนี้เราจะใช้หนึ่งในบริการจาก Google Vision นั้นก็คือ Optical Character Recognition (OCR) หรือที่เรารู้จักกัน คือการแกะตัวอักษรจากรูปภาพ หากต้องการทราบความสามารถ Google Vision ทั้งหมด แน่นอนว่ามีฟีเจอร์อีกมากมายที่บทความนี้ไม่ได้พูดถึง ให้เข้าไปดูรายละเอียดได้ที่ลิงก์ https://cloud.google.com/vision
🌟 ภาษาโปรแกรมมิ่งที่ใช้ทดสอบการใช้งาน Google Vision ในตัวอย่างบทความเราจะเลือกใช้ Node.js และเรียก REST API เพื่อใช้งาน OCR มาแกะตัวอักษรป้ายทะเบียนรถ
🌟 ขั้นตอนการทำงานของโปรแกรม
**📌 Step 1 **Line Messaging API ใช้เพื่อส่งรูปภาพจากแชทไลน์ ไปประมวลผลบน Server
วิธีการตั้งค่าการใช้งาน Line Messaging API มีบทความในอินเทอร์เน็ตค่อนข้างเยอะเลยทีเดียว เช่น
13 สัญญาณจาก Webhook Events ที่จะปลุกให้ LINE Bot ของคุณตื่นจากภวังค์
[Chat Bot ง่ายๆ ด้วย Line Messaging API !! PHP, NodeJS, Heroku] แบบ Step by step
📌 Step 2 Node.js ใช้เพื่อการประมวลผล Webhook (Line Messaging API)
Source Code : https://github.com/Gr4vity4/Google-Vision-OCR
📌 Step 3 Google Vision ใช้ฟีเจอร์ OCR เพื่ออ่านป้ายทะเบียนรถ โดยประมวลผลที่รับมาจาก Node.js และส่งผลลัพธ์กลับ
หมายเหตุ : ให้ทำการสร้าง Credential ในส่วน API Key ให้เรียบร้อยก่อน เพื่อที่เราจะนำ Key ที่ได้ไปใช้งานภายใน REST API
และตรวจสอบการเปิดใช้งาน Library Cloud Vision API