CuneiForm | |
---|---|
Sorts | optisk teckenigenkänning |
Författare | Kognitiv teknik |
Utvecklare | CuneiForm-Linux Team |
Skrivet i | C , C++ |
Gränssnitt | kommandorad |
Operativ system | Linux , Mac OS X och andra UNIX-liknande |
Första upplagan | 1996 |
senaste versionen | 1.1.0 (19 april 2011 [1] ) |
Genererade filformat | HOCR |
stat | övergiven |
Licens | BSD -liknande licens från Cognitive Technologies [2] |
Hemsida | launchpad.net/cuneiform-… |
CuneiForm ( eng. cuneiform , cuneiform - cuneiform ), Cognitive OpenOCR är ett fritt distribuerat öppet system för optisk textigenkänning av det ryska företaget Cognitive Technologies .
OCR CuneiForm utvecklades av Cognitive Technologies som en kommersiell produkt 1993. Systemet levererades med de mest populära modellerna av skannrar, MFP:er och programvara i Ryssland och världen: Corel Draw, Hewlet-Packard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti, etc. 2008, Cognitive Technologies öppnade källkoderna för OCR Cunei Form.
CuneiForm är positionerat som ett system för att konvertera elektroniska kopior av pappersdokument och grafiska filer till en redigerbar form med möjligheten att bevara originaldokumentets struktur och typsnitt i automatiskt eller halvautomatiskt läge. Systemet innehåller två program för enkel- och batchbehandling av elektroniska dokument.
Lista över språk som stöds av systemet:
Dessutom stöds en blandning av ryska och engelska. Igenkänning av blandningar av andra språk stöds endast i en gren utvecklad av Andrey Borovsky 2009 [3] . Att lära ut andra språk är svårt på grund av anslutningen av varje språk till en dat-fil, strukturen och metoden för att erhålla som inte avslöjades av utvecklarna.
1993 - Cognitive Technologies ingick ett OEM-kontrakt med det kanadensiska företaget Corel Corporation , enligt vilket biblioteket för kognitiv igenkänning är inbyggt i det populära publiceringspaketet Corel Draw 3.0 (och efterföljande versioner). [fyra]
1994 - Ett kontrakt undertecknades med Hewlett-Packard för den kompletta uppsättningen skannrar som levereras till Ryssland av OCR CuneiForm. Detta är HP:s första kontrakt med en rysk mjukvaruutvecklare. [5] [6] [7] [8]
1995 - Ett kontrakt undertecknades med det japanska företaget Epson för den kompletta uppsättningen av CuneiForm OCR-skannrar. [9] Ett OEM-kontrakt undertecknades med världens största tillverkare av faxmaskiner, laserskrivare, skannrar och annan kontorsutrustning - Brother Corporation. Enligt avtalet kommer den nya rullskannern Brother IC-150 att vara utrustad med kognitiv programvara för scanning, igenkänning runt om i världen.
1996 - Ett OEM-kontrakt tecknades med en av världens största tillverkare av bildskärmar, faxar, laserskrivare, multifunktionsenheter och annan kontorsutrustning - Samsung Information Systems America. [10] Enligt avtalet kommer den nya multifunktionsenheten Samsung OFFICE MASTER OML-8630A att säljas med Cognitive Cuneiform LE optiska teckenigenkänningssystem över hela världen.
Adaptiv igenkänning är en metod baserad på en kombination av två typer av utskrivbara teckenigenkänningsalgoritmer: teckensnittsbaserad (multifont) och teckensnittsoberoende (omnifont). Systemet genererar ett internt teckensnitt för varje inmatningsdokument, baserat på väl utskrivna tecken, det vill säga dynamisk justering (anpassning) till specifika inmatningstecken används. Således kombinerar metoden mångsidigheten och tillverkningsbarheten hos det teckensnittslösa tillvägagångssättet och den höga noggrannheten för teckensnittsigenkänning, vilket gör det möjligt att radikalt förbättra kvaliteten på igenkänningen.
1997 - CuneiForm-systemet var det första som använde teknik baserad på neurala nätverk. Algoritmer som använder neurala nätverk för teckenigenkänning är uppbyggda enligt följande. Den teckenbild (raster) som kommer för igenkänning reduceras till en viss standardstorlek (normaliserad). Ljusstyrkevärdena vid noderna i det normaliserade rastret används som ingångsparametrar för det neurala nätverket. Antalet utgångsparametrar för det neurala nätverket är lika med antalet igenkännbara tecken. Resultatet av igenkänning är symbolen som motsvarar det största av värdena för utgångsvektorn i det neurala nätverket.
2001 - Ett OEM-kontrakt undertecknades för komplett utrustning tillverkad av Canon (skannrar, multifunktionsenheter) med programvara för Cognitive Technologies (OCR CuneiForm) i Östeuropa.
Den 12 december 2007 släpptes en gratisversion av OCR CuneiForm och dess källkod tillkännagavs [15] . [16] [17]
Den 2 april 2008 publicerades Cuneiforms OCR-källkod under en BSD-licens [18] och på hösten källkoden för systemgränssnittet [19] .
Den senaste OpenSource-versionen för Windows har inte uppdaterats sedan februari 2009.
Under 2009 släpptes grafiska gränssnitt för den öppna versionen av Cuneiform baserat på Qt 4 -biblioteket - Cuneiform-Qt [20] , YAGF . Sedan version 0.9.0 [21] kan Linux-versionen med öppen källkod användas som en .
Programvara för optisk teckenigenkänning | |||
---|---|---|---|
fri |
| ||
Proprietär |
|