เกี่ยวกับเครื่องมือนี้
อ่านข้อความออกจากรูปภาพใดก็ได้ ไม่ว่าจะเป็นภาพถ่าย ภาพหน้าจอ หรือหน้ากระดาษที่สแกน โดยใช้เอนจิน OCR ของ Tesseract ที่คอมไพล์เป็น WebAssembly และทำงานทั้งหมดในเบราว์เซอร์ของคุณ รูปภาพจะไม่ถูกอัปโหลดที่ใดเลย โมเดล OCR จะถูกดาวน์โหลดเพียงครั้งเดียว (แล้วเก็บแคชไว้) และการจดจำข้อความทั้งหมดเกิดขึ้นบนอุปกรณ์ของคุณ
คำถามที่พบบ่อย
รูปภาพของฉันถูกอัปโหลดไปยังเซิร์ฟเวอร์ OCR หรือไม่?
ไม่ โดยปกติ OCR จะทำงานบนคลาวด์ แต่ที่นี่เอนจิน Tesseract แบบเต็มทำงานในเครื่องของคุณในรูปแบบ WebAssembly รูปภาพและข้อความที่จดจำได้จึงไม่เคยออกจากเบราว์เซอร์ของคุณ
ทำไมการรันครั้งแรกจึงใช้เวลาสองสามวินาที?
เพราะต้องโหลดเอนจิน OCR แบบ WASM และโมเดลภาษาอังกฤษ (ประมาณ 6 MB) ในครั้งแรก ทั้งสองอย่างจะถูกเก็บแคชไว้หลังจากนั้น การรันครั้งต่อ ๆ ไปจึงเริ่มทำงานได้อย่างรวดเร็ว
ทำอย่างไรจึงจะได้ผลลัพธ์ที่ดีที่สุด?
ใช้รูปภาพที่ชัดเจน มีคอนทราสต์สูง และค่อนข้างตรง ปัจจุบันการจดจำใช้โมเดลภาษาอังกฤษและทำงานได้ดีที่สุดกับข้อความที่เป็นตัวพิมพ์