Anne G
2008-11-01 16:55:24 UTC
Google applique automatiquement la reconnaissance de caractères sur les
documents scannés et sauvegardés en PDF.
L'article est ici sur leur blogue :
http://googleblog.blogspot.com/2008/10/picture-of-thousand-words.html
Je viens d'essayer avec un document que j'ai mis en ligne sans ocr :
http://www.partdelange.org/linotype/PDF/Linotype0526_R.pdf
En faisant une recherche sur une partie du texte de la page 4, j'obtiens
ceci :
<http://www.google.fr/search?as_q=qui+explique+les+efforts+successifs+des+cr%C3%A9ateurs+du+nouveau+caract%C3%A8re+et+des+r%C3%A9novateurs+de+&hl=fr&num=10&btnG=Recherche+Google&as_epq=l%27ancien&as_oq=&as_eq=&lr=&cr=&as_ft=i&as_filetype=pdf&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=&as_rights=&safe=images>
Soit mon document complet, sans les lettrines, évidemment, faut pas
rêver :-)
documents scannés et sauvegardés en PDF.
L'article est ici sur leur blogue :
http://googleblog.blogspot.com/2008/10/picture-of-thousand-words.html
Je viens d'essayer avec un document que j'ai mis en ligne sans ocr :
http://www.partdelange.org/linotype/PDF/Linotype0526_R.pdf
En faisant une recherche sur une partie du texte de la page 4, j'obtiens
ceci :
<http://www.google.fr/search?as_q=qui+explique+les+efforts+successifs+des+cr%C3%A9ateurs+du+nouveau+caract%C3%A8re+et+des+r%C3%A9novateurs+de+&hl=fr&num=10&btnG=Recherche+Google&as_epq=l%27ancien&as_oq=&as_eq=&lr=&cr=&as_ft=i&as_filetype=pdf&as_qdr=all&as_occt=any&as_dt=i&as_sitesearch=&as_rights=&safe=images>
Soit mon document complet, sans les lettrines, évidemment, faut pas
rêver :-)
--
http://2graphistesencavale.blogspot.com/
http://2graphistesencavale.blogspot.com/