วิธีการ extract เฉพาะ text จาก Image และ PDF

OCR Terminal (www.ocrterminal.com) เป็น free online tool อีกตัวหนึ่งที่น่าสนใจ โดยเว็บไซด์นี้มีความสามารถในการจดจำคำหรือ text ต่าง ๆ ได้ ทำให้คุณสามารถใช้เว็บไซด์นี้มาแปลงไฟล์รูปภาพ หรือ PDF ที่มี text อยู่ออกมาเป็นไฟล์ text ได้ พูดง่าย ๆ คือ OCR Terminal สามารถถอดข้อความหรือตัวอักษรออกจากไฟล์ประเภทรูปภาพ และ PDF ได้นั่นเอง

ocrterminal

เพียงคุณเลือก upload ไฟล์ PDF หรือไฟล์รูปภาพที่ต้องการทำการ extract text ขึ้นไปบนเว็บไซด์ของ OCR Terminal ก็สามารถทำงานได้อย่างง่ายดาย หลังจากที่คุณ upload ไฟล์เสร็จเรียบร้อยแล้ว เว็บไซด์นี้จะแสดงหน้า preview ให้คุณเห็นเื่พื่อให้คุณทำการยืนยันไฟล์ที่ได้ upload ไปแล้วนั้น

freeonlinepdfandimagetotext

คุณสามารถแปลงไฟล์เป็น text ได้ทั้งหมด 30 หน้าต่อวัน ซึ่งถ้าคุณต้องการมากกว่านี้คุณต้องติดต่อกับเจ้าหน้าที่ของเว็บไซด์

extracttextfromimage

จากรูปข้างบนเป็นขั้นตอนหลังจากที่คุณได้ upload ไฟล์ขึ้นไปบนเว็บไซด์ แล้วให้คลิ๊กที่ yes เพื่อเริ่มกระบวนการ ซึ่งการทำงานในการแปลงไฟล์ไปเป็น text นั้นจะใช้เวลาต่างกันไปขึ้นอยู่กับขนาดของไฟล์ และขึ้นอยู่กับว่าขณะนั้น server ของ OCR Terminal ถูกเรียกใช้งานมากน้อยแค่ไหน

หลังจากที่เสร็จสิ้นกระบวนการแล้ว คุณสามารถดาวน์โหลด text ที่ได้จากการ convert ได้หลาย format ด้วยกันไม่ว่าจะเป็น txt, doc, rtf และ pdf ดังรูปที่แสดงข้างล่างนี้

ocrsuccessfullycompleted

Below is the comparison of text extracted from an image of one of AddictiveTips’s post.
ภาพข้างล่างนี้เป็นหน้าจอที่แสดงการเปรียบเทียบ text ที่ถูก extract ออกมากจากไฟล์รูปภาพ

comparisionoftextextractedfromimage1

เว็บไซด์นี้สามารถใช้งานได้ง่าย ไม่มีอะไรซับซ้อน และไม่จำเป็นต้องลงโปรแกรมอะไรบนเครื่องของคุณให้วุ่นวายก็สามารถใช้งานได้

บทความโดย 7boot.com