Discussion:
Google fait de l'OCR
(trop ancien pour répondre)
Anne G
2008-11-01 16:55:24 UTC
Permalink
Google applique automatiquement la reconnaissance de caractères sur les
documents scannés et sauvegardés en PDF.

L'article est ici sur leur blogue :
http://googleblog.blogspot.com/2008/10/picture-of-thousand-words.html

Je viens d'essayer avec un document que j'ai mis en ligne sans ocr :
http://www.partdelange.org/linotype/PDF/Linotype0526_R.pdf

En faisant une recherche sur une partie du texte de la page 4, j'obtiens
ceci :
<http://www.google.fr/search?as_q=qui+explique+les+efforts+successifs+des+cr%C3%A9ateurs+du+nouveau+caract%C3%A8re+et+des+r%C3%A9novateurs+de+&hl=fr&num=10&btnG=Recherche+Google&as_epq=l%27ancien&as_oq=&as_eq=&lr=&cr=&as_ft=i&as_filetype=pdf&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=&as_rights=&safe=images>

Soit mon document complet, sans les lettrines, évidemment, faut pas
rêver :-)
--
http://2graphistesencavale.blogspot.com/
Jean-Marie Schwartz
2008-11-03 09:22:10 UTC
Permalink
Vous lisez mes messages et vous faites bien. Le 1/11/08 17:55, Anne G a
Post by Anne G
Google applique automatiquement la reconnaissance de caractères sur les
documents scannés et sauvegardés en PDF.
http://googleblog.blogspot.com/2008/10/picture-of-thousand-words.html
http://www.partdelange.org/linotype/PDF/Linotype0526_R.pdf
En faisant une recherche sur une partie du texte de la page 4, j'obtiens
<http://www.google.fr/search?as_q=qui+explique+les+efforts+successifs+des+cr%C
3%A9ateurs+du+nouveau+caract%C3%A8re+et+des+r%C3%A9novateurs+de+&hl=fr&num=10&
btnG=Recherche+Google&as_epq=l%27ancien&as_oq=&as_eq=&lr=&cr=&as_ft=i&as_filet
ype=pdf&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=&as_rights=&safe=images>
Soit mon document complet, sans les lettrines, évidemment, faut pas
rêver :-)
Ça alors !
--
Jean-Marie

« On vous souhaite tout le bonheur du monde » (Sinsemilia)
Continuer la lecture sur narkive:
Loading...