Công nghệ 4.0 phát triển kéo theo đó là hàng loạt các phần mềm và công nghệ mới hỗ trợ giúp con người nâng cao hiệu quả công việc. Một trong số đó phải kể đến phần mềm nhận dạng chữ OCR.
Công nghệ nhận dạng chữ OCR là gì?
Công nghệ nhận dạng chữ in OCR
Công nghệ nhận dạng chữ OCR (tiếng anh: Optical Character Recognition, viết tắt là OCR), tên tiếng Việt là: Nhận dạng ký tự bằng quang học, là loại phần mềm máy tính được tạo ra để chuyển đổi tài liệu dạng ảnh (các ảnh đầu ra của máy quét, máy ảnh, file PDF dạng ảnh,…) thành các văn bản tài liệu có thể biên tập được (file text, file Word…).
Với một số tài liệu giấy như sách, báo, tờ rơi quảng cáo, hợp đồng,…máy quét chỉ có thể chuyển những tài liệu giấy này thành tài liệu dạng ảnh. Với các tài liệu dạng ảnh, người dùng chỉ có thể đọc mà không thể biên tập lại chúng trên các hệ soạn thảo văn bản hiện nay. Mặt khác, với các tài liệu dạng ảnh như vậy, hệ thống tìm kiếm chỉ có thể tìm kiếm được tiêu đề chứ không thể tìm được các đoạn văn bản trên những tài liệu này.
Với việc sử dụng phần mềm nhận dạng chữ in, bài toán tìm kiếm toàn văn, trích dẫn, biên soạn lại các tài liệu dạng ảnh sẽ được thực hiện rất đơn giản.
Một trong những phần mềm/công nghệ về nhận dạng chữ OCR được biết đến và ứng dụng nhiều nhất hiện nay có thể kế đến như: ABBYY FineReader, OmniPage, IONE,….
Công nghệ nhận dạng IONE
IONE – giải pháp nhận dạng và bóc tách thông tin tự động
Nhận thấy những tiềm năng to lớn và khả năng ứng dụng rộng rãi của công nghệ này trong hiện tại và tương lai, Công ty Cổ phần Đầu tư thương mại và Phát triển công nghệ FSI – doanh nghiệp hàng đầu trong lĩnh vực chuyển đổi số tại Việt Nam đã nghiên cứu và cho ra đời công nghệ nhận dạng chữ tiếng việt IONE.
IONE là giải pháp nhận dạng và bóc tách thông tin tự động cho phép xử lý dữ liệu lớn trong thời gian ngắn. Các ảnh đầu vào qua xử lý của IONE cho ra dữ liệu văn bản, metadata để lưu trữ hoặc tích hợp vào các hệ thống khác.
Một ưu điểm lớn của IONE là công nghệ này có thể dễ dàng tích hợp với các hệ thống phần mềm nghiệp vụ có sẵn của khách hàng, giúp tiết kiệm tối đa thời gian làm việc.
Ưu điểm nổi bật của IONE:
– Nhận dạng tiếng Việt chính xác lên đến 98%
– Số hóa giản đồ, hình ảnh đạt độ chính xác trên 90%
– Xử lý song song, đạt hiệu suất 6s/trang
– Bóc tách dữ liệu tự động không phụ thuộc vào biểu mẫu
– Sẵn sàng tích hợp với các hệ thống của khách hàng
– Cơ chế học máy giúp hệ thống tự động nâng cao độ chính xác.
Những lợi ích của IONE có thể kể đến như:
– Thông tin được nhận dạng và bóc tách thông tin tự động giúp xử lý dữ liệu lớn trong thời gian ngắn
– Giảm thiểu sai xót do nhập liệu thủ công
– Tiết kiệm cho phí nhân sự xử lý dữ liệu
– Tăng tính bảo mật, an toàn thông tin cho doanh nghiệp
– Tăng hiệu quả giải quyết công việc và chất lượng phục vụ khách hàng
– Tăng tuổi thọ cho hồ sơ, tài liệu truyền thống
Tính năng ưu việt của công nghệ:
– Bóc tách và nhận dạng tự động thông tin: Tài liệu khi đưa lên hệ thống, người dùng chọn lựa loại tài liệu ( công văn, báo cáo, quyết định hoặc một số dạng khác,…). Tài liệu sau đó được nhận dạng OCR chuyển sang dạng text và tự động bóc tách các trường thông tin cần thiết.
– Bóc tách và nhận dạng theo form mẫu do người dùng định nghĩa: Người dùng định nghĩa các vùng cần bóc tách, sau đó lưu thành. Khi đưa tài liệu lên hệ thống, người dùng chọn mẫu tài liệu tương ứng. Sau đó hệ thống sẽ tự động nhận dạng và trích xuất thông tin tại các vùng được đánh dấu trong mẫu
– Bóc tách và nhận dạng trực tiếp trên file tài liệu: Người dùng chọn file cần bóc tách thông tin sau đó lựa chọn vùng ảnh và gán vùng ảnh đó với trường thông tin cụ thể, hệ thống sẽ nhận dạng và tự động đưa vào các trường thông tin tương ứng đó.
Hệ thống phần mềm công nghệ nhận dạng chữ viết IONE đã được áp dụng triển khai tại nhiều dự án số hóa lớn của FSI trên cả nước và nhận được nhiều đánh giá cao từ phía khách hàng.
Một số ý kiến đánh giá từ khách hàng đã ứng dụng công nghệ IONE và dịch vụ số hóa của FSI:
Ông Nguyễn Khắc Trọng – Sở quy hoạch kiến trúc
Tôi đánh giá công ty FSI là một đơn vị trẻ, năng động, nhiệt tình, chuyên nghiệp, bài bản. Vì vậy các dự án thực hiện ở Sở đáp ứng được tiến độ và chất lượng theo yêu cầu. Tôi đánh giá công ty đã biết đầu tư theo chiều sâu, có trọng điểm, đặc biệt việc triển khai giải pháp nhận dạng về tiếng Việt. Với định hướng phát triển như vậy, FSI sẽ có nhiều tiềm năng phát triển trong tương lai.
Bà Nguyễn Phương Mai – Phó chủ tịch hội quốc tế ngữ Việt Nam
“Tôi đánh giá cao dịch vụ số hóa tài liệu của FSI, trong quá trình làm việc, các bạn rất nhiệt tình, công việc triển khai nhanh chóng, chất lượng bản scan đẹp ngoài mong đợi. Đặc biệt khi nhận lại bản gốc, chúng tôi nhận thấy vẫn còn y nguyên như cũ nên rất hài lòng. Nếu có các dự án khác, chúng tôi vẫn sẽ tin tưởng và lựa chọn FSI là đối tác của mình.”
Chị Chu Thu Hà – Trưởng phòng bán hàng DB Schenker
Nhờ có dịch vụ số hóa tài liệu của FSI, các thông tin về hồ sơ nhập khẩu và vận đơn của chúng tôi được lưu trữ có hệ thống hơn. Khi có nhu cầu sử dụng các thông tin này, chỉ cần các thao tác đơn giản, chúng tôi đã dễ dàng tìm thấy thông tin mình cần, điều này khiến công việc được cải thiện đáng kể. Đội ngũ triển khai nhanh, hỗ trợ tốt, chúng tôi sẽ hợp tác tiếp với FSI trong các dự án tiếp theo.”
Liên hệ để được tư vấn miễn phí: https://ionetech.com.vn/dang-ky.html
Công ty Cổ phần Đầu tư thương mại và Phát triển công nghệ FSI
Hotline: 0904 805 2155
Email: support@fsivietnam.com.vn