Pages

Subscribe:

Sunday, 11 March 2012

Optical character recognition (ocr)

Pengenalan karakter optik, biasanya disingkat OCR, adalah terjemahan mekanik atau elektronik dari scan gambar dari teks tulisan tangan, diketik atau dicetak ke dalam mesin-encoded teks. Hal ini banyak digunakan untuk mengkonversi buku-buku dan dokumen ke dalam file elektronik, untuk komputerisasi sistem pencatatan di kantor, atau untuk menerbitkan teks pada situs web. OCR memungkinkan untuk mengedit teks, cari kata atau frase, menyimpannya lebih kompak, menampilkan atau mencetak salinan gratis dari pemindaian artefak, dan menerapkan teknik seperti mesin penerjemahan, text-to-speech dan pertambangan teks untuk itu. OCR adalah bidang penelitian dalam pengenalan pola, kecerdasan buatan dan visi komputer.

Sistem OCR memerlukan kalibrasi untuk membaca font tertentu; versi awal yang dibutuhkan untuk diprogram dengan gambar karakter masing-masing, dan bekerja pada satu font pada suatu waktu. "Cerdas" sistem dengan tingkat akurasi yang tinggi pengakuan untuk font yang paling umum sekarang. Beberapa sistem yang mampu mereproduksi output diformat yang erat mendekati memindai halaman asli termasuk gambar, kolom dan non-tekstual komponen.Isi                                                   

    
1 Sejarah
    
2 OCR software
    
3 Sekarang keadaan teknologi OCR
    
4 Lihat pula
    
5 Referensi
    
6 Pranala luar[Sunting] SejarahPada tahun 1929 Gustav Tauschek memperoleh paten pada OCR di Jerman, diikuti oleh Paul W. Handel yang memperoleh hak paten AS pada OCR di Amerika Serikat pada tahun 1933 (US Patent 1.915.993). Pada tahun 1935 Tauschek juga diberikan paten AS pada metodenya (US Patent 2.026.329). Mesin Tauschek adalah alat mekanis yang digunakan template dan photodetektor.Pada tahun 1949 insinyur RCA bekerja pada komputer primitif pertama-jenis OCR untuk membantu orang buta untuk AS Veteran Administrasi, tapi bukannya mengubah karakter cetakan ke bahasa mesin, perangkat mereka dikonversi ke bahasa mesin dan kemudian berbicara huruf. Ini terbukti terlalu mahal dan tidak dikejar setelah pengujian. [1]Pada tahun 1950, David H. Shepard, seorang kriptanalis di Badan Keamanan Angkatan Bersenjata di Amerika Serikat, membahas masalah mengkonversi pesan dicetak ke dalam bahasa mesin untuk pemrosesan komputer dan membangun sebuah mesin untuk melakukan ini, dilaporkan dalam Berita Harian Washington pada tanggal 27 April 1951 dan di New York Times pada tanggal 26 Desember 1953 setelah ia Paten AS 2.663.758 dikeluarkan. Shepard kemudian mendirikan Cerdas Mesin Research Corporation (IMR), yang kemudian memberikan sistem pertama di dunia OCR beberapa digunakan dalam operasi komersial.Pada tahun 1955, sistem komersial pertama dipasang di Reader Digest itu. Sistem kedua dijual kepada Standard Oil Company untuk membaca cetakan kartu kredit untuk tujuan penagihan. Sistem lain yang dijual oleh AKB selama akhir 1950-an termasuk pembaca tulisan rintisan tagihan kepada Perusahaan Telepon Bell Ohio dan scanner halaman kepada Angkatan Udara Amerika Serikat untuk membaca dan mengirimkan pesan dengan teletype diketik. IBM dan yang lainnya kemudian lisensi paten pada OCR Shepard itu.Pada sekitar 1965, Reader 's Digest dan RCA bekerja sama untuk membangun sebuah pembaca Dokumen OCR dirancang untuk mendigitalisasi nomor seri pada kupon Reader' s Digest kembali dari iklan. Font yang digunakan pada dokumen yang dicetak oleh printer Drum RCA menggunakan OCR-A font. Pembaca dihubungkan langsung ke komputer RCA 301 (salah satu komputer negara bagian pertama padat). Pembaca ini diikuti oleh pembaca dokumen khusus dipasang di TWA mana pembaca diproses saham Airline tiket. Para pembaca dokumen diproses dengan kecepatan 1.500 dokumen per menit, dan diperiksa setiap dokumen, menolak orang-orang itu tidak dapat memproses dengan benar. Produk ini menjadi bagian dari lini produk RCA sebagai pembaca dirancang untuk memproses "Berbalik Dokumen" seperti tagihan listrik dan asuransi kembali dengan pembayaran.Amerika Serikat Layanan Pos telah menggunakan mesin OCR untuk menyortir surat sejak tahun 1965 berdasarkan teknologi terutama dirancang oleh penemu Yakub produktif Rabinow. Penggunaan pertama dari OCR di Eropa adalah dengan Kantor Pos Inggris (GPO). Pada tahun 1965 ia mulai merencanakan seluruh sistem perbankan, di Giro Nasional, menggunakan teknologi OCR, sebuah proses yang merevolusi sistem pembayaran tagihan di Inggris. Posting Kanada telah menggunakan sistem OCR sejak tahun 1971 [rujukan?]. Sistem OCR membaca nama dan alamat penerima di pusat pemilahan mekanis pertama, dan mencetak bar code routing pada amplop berdasarkan kode pos. Untuk menghindari kebingungan dengan bidang alamat terbaca-manusia yang dapat ditemukan di mana saja surat, tinta khusus (jeruk dalam cahaya tampak) digunakan yang jelas terlihat di bawah sinar ultraviolet. Amplop kemudian dapat diproses dengan peralatan berdasarkan pembaca barcode sederhana.Pada tahun 1974 Ray Kurzweil memulai perusahaan Kurzweil Computer Products, Inc dan pengembangan dipimpin dari sistem omni-font pengenalan karakter optik pertama - sebuah program komputer yang mampu mengenali teks dicetak dalam font normal. Dia memutuskan bahwa penerapan terbaik dari teknologi ini akan menciptakan mesin membaca untuk orang buta, yang akan memungkinkan orang buta untuk memiliki komputer membaca teks kepada mereka dengan suara keras. Perangkat ini diperlukan penemuan dua teknologi yang memungkinkan - scanner CCD flatbed dan synthesizer text-to-speech. Pada tanggal 13 Januari 1976 produk jadi sukses ini diresmikan dalam konferensi pers secara luas yang dilaporkan dipimpin oleh Kurzweil dan para pemimpin Federasi Nasional Tunanetra [kutipan diperlukan].Pada tahun 1978 Kurzweil Komputer Produk mulai menjual versi komersial dari program pengenalan karakter optik komputer. LexisNexis adalah salah satu pelanggan pertama, dan membeli program untuk meng-upload dokumen kertas hukum dan berita ke database baru lahir secara online. Dua tahun kemudian, Kurzweil menjual perusahaannya ke Xerox, yang memiliki minat pada lanjut komersialisasi kertas-ke-komputer konversi teks. Kurzweil Komputer Produk menjadi anak perusahaan dari Xerox dikenal sebagai Scansoft, sekarang Nuansa Komunikasi [kutipan diperlukan].1992-1996 Ditugaskan oleh Departemen Energi AS (DOE), Informasi Science Research Institute (Balittanah) dilakukan paling otoritatif Test Tahunan Akurasi OCR selama 5 tahun berturut-turut pada pertengahan 90-an. Informasi Science Research Institute (Balittanah) merupakan penelitian dan pengembangan unit dari Universitas Nevada, Las Vegas. Balittanah didirikan pada tahun 1990 dengan dana dari Departemen Energi AS. Misinya adalah untuk mendorong peningkatan teknologi mesin otomatis untuk dokumen dicetak pemahaman [kutipan diperlukan].[Sunting] OCR softwareDesktop & Server OCR SoftwareOCR perangkat lunak dan teknologi ICR perangkat lunak sistem intelijen analitis buatan yang menganggap rangkaian karakter bukan kata-kata keseluruhan atau frase. Berdasarkan analisis garis berurutan dan kurva, OCR dan ICR membuat 'tebakan terbaik' pada karakter menggunakan database look-up tabel untuk mengasosiasikan erat atau yang cocok dengan string karakter yang membentuk kata.WebOCR & OnlineOCRDengan TI pengembangan teknologi, platform bagi orang untuk menggunakan perangkat lunak yang telah berubah dari platform PC tunggal untuk multi-platform seperti PC + berbasis Web + + Cloud Computing perangkat Mobile. Setelah pembangunan 30 tahun, OCR software mulai beradaptasi dengan kebutuhan aplikasi baru. WebOCR juga dikenal sebagai layanan OCR OnlineOCR atau berbasis Web, telah menjadi tren baru untuk memenuhi volume yang lebih besar dan kelompok yang lebih besar pengguna setelah 30 tahun pembangunan dari OCR desktop. Internet dan broadband teknologi telah membuat WebOCR & OnlineOCR praktis tersedia untuk pengguna individu dan pelanggan perusahaan. Sejak tahun 2000, beberapa OCR besar vendor mulai menawarkan WebOCR & software Online, sejumlah perusahaan pendatang baru untuk merebut kesempatan untuk mengembangkan inovatif berbasis Web layanan OCR, beberapa di antaranya gratis layanan biaya.Aplikasi Berorientasi OCRKarena teknologi OCR telah lebih dan lebih banyak diterapkan pada kertas-intensif industri, menghadapi lingkungan yang lebih kompleks gambar dalam dunia nyata. Sebagai contoh: latar belakang rumit, rusak-gambar, berat kebisingan, kertas miring, distorsi gambar, resolusi rendah, terganggu oleh grid & garis, teks gambar yang terdiri dari font khusus, simbol, kata-kata daftar istilah dan dll Semua faktor yang mempengaruhi produk OCR 'stabilitas dalam akurasi pengakuan.Dalam beberapa tahun terakhir, OCR utama penyedia teknologi mulai mengembangkan sistem OCR berdedikasi, masing-masing untuk jenis khusus gambar. Mereka menggabungkan berbagai metode optimasi yang berhubungan dengan citra khusus, seperti aturan bisnis, ekspresi standar, glossary atau kamus dan kaya informasi yang terkandung dalam gambar berwarna, untuk meningkatkan akurasi pengenalan.Strategi tersebut untuk menyesuaikan teknologi OCR disebut "Aplikasi Berorientasi OCR" atau "OCR Disesuaikan", banyak digunakan di bidang Bisnis-kartu OCR, OCR Faktur, Screenshot OCR, KTP OCR, Driver-lisensi OCR atau Auto tanaman OCR, dan sebagainya.Lihat juga: Daftar perangkat lunak pengenalan karakter optik[Sunting] negara kini teknologi OCRBagian ini memerlukan tambahan citations untuk verifikasi. Harap membantu memperbaiki artikel ini dengan menambahkan citations ke sumber terpercaya. Bahan mungkin cacat dan dibuang. (Mei 2009)Pengakuan Latin-script, teks diketik masih tidak 100% akurat bahkan di mana pencitraan yang jelas tersedia. Satu studi berdasarkan pengakuan ke-19 dan awal abad ke-20 halaman surat kabar menyimpulkan bahwa oleh karakter-karakter akurasi OCR untuk perangkat lunak OCR komersial bervariasi dari 71% menjadi 98%; [2] akurasi total dapat dicapai hanya dengan peninjauan manusia. Daerah lainnya-termasuk pengakuan pencetakan tangan, tulisan tangan kursif, dan teks dicetak dalam script lainnya (terutama yang karakter bahasa Asia Timur yang memiliki banyak stroke untuk karakter tunggal)-masih merupakan subjek penelitian aktif.Tingkat akurasi dapat diukur dengan beberapa cara, dan bagaimana mereka diukur dapat sangat mempengaruhi tingkat akurasi dilaporkan. Misalnya, jika kata konteks (pada dasarnya leksikon kata) tidak digunakan untuk memperbaiki perangkat lunak menemukan tidak ada kata-kata, kesalahan karakter tingkat 1% (99% akurasi) dapat mengakibatkan tingkat kesalahan 5% (95% akurasi ) atau lebih buruk jika pengukuran didasarkan pada apakah setiap kata seluruh diakui tanpa surat tidak benar. [3]On-line pengenalan karakter kadang-kadang bingung dengan Optical Character Recognition [4] (lihat Handwriting recognition). OCR adalah turunan dari off-line pengenalan karakter, di mana sistem mengakui bentuk statis tetap dari karakter, sedangkan on-line pengenalan karakter bukan mengakui gerak dinamis selama tulisan tangan. Sebagai contoh, on-line pengakuan, seperti yang digunakan untuk gerakan di OS Penpoint atau Tablet PC bisa mengatakan apakah tanda horisontal ditarik kanan-ke-kiri, atau kiri ke kanan. On-line pengenalan karakter ini juga disebut dengan istilah lain seperti pengenalan karakter dinamis, real-time pengenalan karakter, dan Character Recognition Cerdas atau ICR.On-line sistem untuk mengenali sisi-cetak teks dengan cepat telah menjadi dikenal sebagai produk komersial dalam beberapa tahun terakhir (lihat sejarah Tablet PC). Di antaranya adalah perangkat input untuk PDA seperti yang menjalankan Palm OS. Apple Newton memelopori produk ini. Algoritma yang digunakan dalam perangkat ini mengambil keuntungan dari fakta bahwa urutan, kecepatan, dan arah segmen individu baris pada input diketahui. Juga, pengguna dapat dilatih kembali untuk menggunakan bentuk-satunya surat tertentu. Metode ini tidak dapat digunakan dalam perangkat lunak yang memindai dokumen kertas, sehingga pengakuan akurat dari tangan-cetak dokumen adalah sebagian besar masih merupakan masalah terbuka. Akurasi tingkat 80% sampai 90% pada rapi, bersih tangan-cetak karakter dapat dicapai, tetapi tingkat akurasi masih diterjemahkan menjadi kesalahan puluhan per halaman, membuat teknologi yang berguna hanya dalam aplikasi sangat terbatas.Pengakuan teks kursif adalah bidang penelitian aktif, dengan tingkat pengakuan bahkan lebih rendah dari tangan-cetak teks. Tingginya bunga pengakuan naskah kursif umum kemungkinan tidak akan mungkin tanpa menggunakan informasi kontekstual atau gramatikal. Misalnya, mengenali kata-kata dari seluruh kamus lebih mudah daripada mencoba untuk mengurai karakter individu dari script. Membaca garis Jumlah cek (yang selalu sejumlah tulisan-out) adalah contoh di mana menggunakan kamus kecil dapat meningkatkan tingkat pengakuan sangat. Pengetahuan tentang tata bahasa dari bahasa discan juga dapat membantu menentukan apakah sebuah kata adalah cenderung menjadi kata kerja atau kata benda, misalnya, memungkinkan akurasi yang lebih besar. Bentuk karakter kursif individu sendiri hanya tidak mengandung informasi yang cukup untuk secara akurat (lebih dari 98%) mengakui semua script kursif tulisan tangan.Hal ini diperlukan untuk memahami bahwa teknologi OCR adalah teknologi dasar juga digunakan dalam aplikasi pemindaian lanjutan. Karena ini, solusi pemindaian lanjutan dapat menjadi unik dan dipatenkan dan tidak mudah disalin meskipun yang berbasis pada teknologi OCR dasar.Untuk masalah pengakuan lebih kompleks, sistem karakter cerdas pengakuan umumnya digunakan, sebagai jaringan syaraf tiruan dapat dibuat acuh tak acuh terhadap transformasi affine dan kedua non-linear. [5]Sebuah teknik yang mengalami kesuksesan yang cukup besar dalam mengenali kata-kata sulit dan kelompok karakter dalam dokumen umumnya setuju untuk komputer OCR adalah untuk mengirimkan secara otomatis ke manusia dalam sistem reCAPTCHA.


agusandisulhan.blogspot.com

0 comments: