Discussion:
Petit soucis concernant la numérisation de livres
(trop ancien pour répondre)
Pierre-Olivier TAUBATY
2009-08-03 07:15:46 UTC
Permalink
Bonjour à tous,

Je tiens à préciser que je ne suis nullement impliqué
professionnellement dans la P.A.O.

Voila, je suis en train de numériser certains de mes livres. La
numérisation et l'OCR se passent sans trop de problèmes.

Le petit soucis concerne un caractère un peu particulier, c'est le tiret
des dialogues. Il s'agit d'un grand tiret. Or, bien sûr l'OCR me le
remplace par le petit tiret standard classique.

Ce tiret de dialogue a t'il un nom particulier, Comment l'obtenir ? Souw
Word ou Pages.

Merci à ceux qui me feront partager leurs lumières.

Bonne journée à tous.
--
PO.

Pour m'écrire : po_taubaty(arobas)yahoo(point)fr
Contrariness
2009-08-03 10:54:05 UTC
Permalink
Post by Pierre-Olivier TAUBATY
Voila, je suis en train de numériser certains de mes livres. La
numérisation et l'OCR se passent sans trop de problèmes.
Le petit soucis concerne un caractère un peu particulier, c'est le tiret
des dialogues. Il s'agit d'un grand tiret. Or, bien sûr l'OCR me le
remplace par le petit tiret standard classique.
Ce tiret de dialogue a t'il un nom particulier, Comment l'obtenir ? Souw
Word ou Pages.
sur PC, on peut appeller un caractere par son numero ASCII
alt + 045 (sur le pave numerique) = -
alt + 0150 (sur le pave numerique) = –
alt + 0151 (sur le pave numerique) = —

L'aspect du tiret depend aussi de la fonte.

Il me semble que dans Omnipage Pro 11 (c'est la version que j'utilise)
on peut lui apprendre a remplacer de facon automatique, mais jamais teste..
Pierre-Olivier TAUBATY
2009-08-03 15:47:13 UTC
Permalink
Post by Contrariness
Post by Pierre-Olivier TAUBATY
Voila, je suis en train de numériser certains de mes livres. La
numérisation et l'OCR se passent sans trop de problèmes.
Le petit soucis concerne un caractère un peu particulier, c'est le tiret
des dialogues. Il s'agit d'un grand tiret. Or, bien sûr l'OCR me le
remplace par le petit tiret standard classique.
Ce tiret de dialogue a t'il un nom particulier, Comment l'obtenir ? Souw
Word ou Pages.
sur PC, on peut appeller un caractere par son numero ASCII
alt + 045 (sur le pave numerique) = -
alt + 0150 (sur le pave numerique) = –
alt + 0151 (sur le pave numerique) = —
L'aspect du tiret depend aussi de la fonte.
Il me semble que dans Omnipage Pro 11 (c'est la version que j'utilise)
on peut lui apprendre a remplacer de facon automatique, mais jamais teste..
Merci de ta réponse. Seulement, je suis sur Mac, et n'ayant pas
Omnipage, je procède à la numérisation et à l'OCR avec Acrobat Pro. Je
suis d'ailleurs stupéfait de la vitesse à laquelle tout se fait, et sans
quasiment aucune erreur. Bon, faut dire qu'un Mac Pro, ça aide un peu.
Ce qui est dommage c'est que tout cela ne se fait que sur un seul des 8
processeurs (coeurs). J'ose à peine imaginer si on mettait les 8 à
l'oeuvre ... ;-)

Le facteur limitant, c'est clairement la vitesse de numérisation, qui,
étrangement, en mode noir et blanc est plus lente, en balayage du
scanner qu'en mode couleur ... :-(


Donc, si dans l'auguste assemblée, un Macounet connaît l'équivalent de
ton tuyau, qu'il n'hésite pas à se manifester ...
--
PO.

Pour m'écrire : po_taubaty(arobas)yahoo(point)fr
Michel Loiseau
2009-08-03 16:39:07 UTC
Permalink
Post by Pierre-Olivier TAUBATY
Ce tiret de dialogue a t'il un nom particulier, Comment l'obtenir ? Souw
Word ou Pages.
option+-
--
Membre du Comité de Défense Révolutionnaire
de l'encre de chine et du pinceau en poils
de martre Kolinsky.
<http://mloiseau.free.fr/blog>
Pierre-Olivier TAUBATY
2009-08-04 08:11:06 UTC
Permalink
Post by Michel Loiseau
Post by Pierre-Olivier TAUBATY
Ce tiret de dialogue a t'il un nom particulier, Comment l'obtenir ? Souw
Word ou Pages.
option+-
Merci beaucoup. A noter que cela ne fonctionne pas avec le - du pavé
numérique, mais parfaitement avec celui de la première rangée
alphanumérique du clavier.

Ça a quand même plus de gueule une fois le remplacement effectué .

Content, qu'il est le PO ...
--
PO.

Pour m'écrire : po_taubaty(arobas)yahoo(point)fr
Michel Loiseau
2009-08-04 08:53:04 UTC
Permalink
Post by Pierre-Olivier TAUBATY
Ça a quand même plus de gueule une fois le remplacement effectué .
Très nettement et ce détail vous honore.
--
Membre du Comité de Défense Révolutionnaire
de l'encre de chine et du pinceau en poils
de martre Kolinsky.
<http://mloiseau.free.fr/blog>
Jean-Marie Schwartz
2009-08-05 07:37:20 UTC
Permalink
Vous lisez mes messages et vous faites bien. Le 4/08/09 10:11,
Post by Pierre-Olivier TAUBATY
Post by Michel Loiseau
option+-
Merci beaucoup. A noter que cela ne fonctionne pas avec le - du pavé
numérique, mais parfaitement avec celui de la première rangée
alphanumérique du clavier.
Il ne faut pas confondre un tiret avec un signe moins ! Côté pavé numérique,
il est plus logique de trouver le signe moins que le tiretŠ
Donc Option-tiret donne un tiret dit cadratin (pour aller vite de la largeur
égale à la force de corps - si on est en corps 10, le tiret fera environ 10
pt de large, si on est en corps 18, 18 pt de largeŠ).
Le tiret demi-cadratin s'obtient par Majuscule-Option-tiret. Je vous laisse
deviner à quelle largeur il peut correspondre :-)
--
Jean-Marie

« Aux enfants de la chance qui n'ont jamais connu les transes des shoots et
du shit... » (Gainsbourg)
Michel Loiseau
2009-08-05 07:43:31 UTC
Permalink
Post by Jean-Marie Schwartz
Le tiret demi-cadratin s'obtient par Majuscule-Option-tiret. Je vous laisse
deviner à quelle largeur il peut correspondre :-)
Un indice ?
--
Membre du Comité de Défense Révolutionnaire
de l'encre de chine et du pinceau en poils
de martre Kolinsky.
<http://mloiseau.free.fr/blog>
Tardigradus
2009-08-05 09:12:54 UTC
Permalink
Post by Jean-Marie Schwartz
pour aller vite de la largeur
égale à la force de corps - si on est en corps 10, le tiret fera environ 10
pt de large, si on est en corps 18, 18 pt de large…
Pourquoi "pour aller vite" ? C'est bien la définition du cadratin : un
blanc qui chasse comme le corps.
--
Tardigradus
Jean-Marie Schwartz
2009-08-06 08:11:58 UTC
Permalink
Vous lisez mes messages et vous faites bien. Le 5/08/09 11:12, Tardigradus a
Post by Tardigradus
Post by Jean-Marie Schwartz
pour aller vite de la largeur
égale à la force de corps - si on est en corps 10, le tiret fera environ 10
pt de large, si on est en corps 18, 18 pt de largeŠ
Pourquoi "pour aller vite" ? C'est bien la définition du cadratin : un
blanc qui chasse comme le corps.
Le cadratin, oui, mais ici nous parlons de tiret cadratin. Dans certaines
polices, ce tiret fait réellement la chasse complète, mais dans d'autres, il
y a une approche si bien que la largeur réelle du tiret est moindre.
--
Jean-Marie

« Je suis de bonne bonne bonne bonne humeur ce matin, y a des matins comme
ça... » (Tristan)
Tardigradus
2009-08-06 18:19:43 UTC
Permalink
Post by Jean-Marie Schwartz
Dans certaines
polices, ce tiret fait réellement la chasse complète, mais dans d'autres, il
y a une approche si bien que la largeur réelle du tiret est moindre.
Jamais remarqué, mais j'avoue que je n'ai pas cherché. Ça n'a pas
beaucoup de sens, puisque traditionnellement ce tiret est fondu sur
cadratin, donc forcément sans approche. Mais bon, avec le numérique,
c'est comme avec Sarkozy : tout devient possible.
--
Tardigradus
Jean-Marie Schwartz
2009-08-07 07:31:06 UTC
Permalink
Vous lisez mes messages et vous faites bien. Le 6/08/09 20:19, Tardigradus a
Post by Tardigradus
Jamais remarqué, mais j'avoue que je n'ai pas cherché. Ça n'a pas
beaucoup de sens, puisque traditionnellement ce tiret est fondu sur
cadratin, donc forcément sans approche.
C'est bien mon avis aussi, mais apparemment ça ne fait pas l'unanimité :-)
--
Jean-Marie

«Walk This Way» (Run DMC)
Pierre-Olivier TAUBATY
2009-08-05 22:08:27 UTC
Permalink
Post by Jean-Marie Schwartz
Vous lisez mes messages et vous faites bien. Le 4/08/09 10:11,
Post by Pierre-Olivier TAUBATY
Post by Michel Loiseau
option+-
Merci beaucoup. A noter que cela ne fonctionne pas avec le - du pavé
numérique, mais parfaitement avec celui de la première rangée
alphanumérique du clavier.
Il ne faut pas confondre un tiret avec un signe moins ! Côté pavé numérique,
il est plus logique de trouver le signe moins que le tiret…
Donc Option-tiret donne un tiret dit cadratin (pour aller vite de la largeur
égale à la force de corps - si on est en corps 10, le tiret fera environ 10
pt de large, si on est en corps 18, 18 pt de large…).
Le tiret demi-cadratin s'obtient par Majuscule-Option-tiret. Je vous laisse
deviner à quelle largeur il peut correspondre :-)
merci de ces précisions complémentaires.

Je suis en méga rogne contre cette cochonceté de @#$*% ! de Word 2008.
Lorsque je fais une recherche sur "^p-" pour le remplacer par "^p— " IL
PLANTE ! ! PAr contre, si dans l'argument de remplacement, je ne mets
pas l'espace, ça roule. Au début, lorsque je n'avais que quelques
dizaines de pages, ça marchait, mais maintenant que j'approche les 200,
il ne veut rien savoir.

Je sens que je vais passer le document dans PAges, ça va pas tarder.
J'ai payé 2 versions d'Office (la v.X lorsque l'on est passé en MAc OS
X, et la 2008, mais je crois bien que c'est la dernière. J'ai beau les
avoir payé le prix "éduc" pour la première, et "famille" pour la
dernière, c'est encore trop cher payé pour un truc qui n'est pas foutu
de faire un remplacement basique sans planter.

Le jour où Microsoft soritra un truc qui plante pas , ce sera un clou,
immanquablement.
--
PO.

Pour m'écrire : po_taubaty(arobas)yahoo(point)fr
Anne G
2009-08-05 22:40:29 UTC
Permalink
Post by Pierre-Olivier TAUBATY
Lorsque je fais une recherche sur "^p-" pour le remplacer par "^p— " IL
PLANTE ! !
:-)))))))
Post by Pierre-Olivier TAUBATY
PAr contre, si dans l'argument de remplacement, je ne mets
pas l'espace, ça roule. Au début, lorsque je n'avais que quelques
dizaines de pages, ça marchait, mais maintenant que j'approche les 200,
il ne veut rien savoir.
Je sens que je vais passer le document dans PAges, ça va pas tarder.
J'ai payé 2 versions d'Office (la v.X lorsque l'on est passé en MAc OS
X, et la 2008, mais je crois bien que c'est la dernière. J'ai beau les
avoir payé le prix "éduc" pour la première, et "famille" pour la
dernière, c'est encore trop cher payé pour un truc qui n'est pas foutu
de faire un remplacement basique sans planter.
Le jour où Microsoft soritra un truc qui plante pas , ce sera un clou,
immanquablement.
Michel Loiseau
2009-08-06 06:34:00 UTC
Permalink
Post by Pierre-Olivier TAUBATY
Le jour où Microsoft soritra un truc qui plante pas , ce sera un clou,
immanquablement.
Joli.
--
Membre du Comité de Défense Révolutionnaire
de l'encre de chine et du pinceau en poils
de martre Kolinsky.
<http://mloiseau.free.fr/blog>
Pierre-Olivier TAUBATY
2009-08-06 14:14:13 UTC
Permalink
Post by Pierre-Olivier TAUBATY
Le jour où Microsoft soritra un truc qui plante pas , ce sera un clou,
immanquablement.
Joli.
c'est pas de moi, hélàs ...
--
PO.

Pour m'écrire : po_taubaty(arobas)yahoo(point)fr
Michel Loiseau
2009-08-06 14:31:39 UTC
Permalink
Post by Pierre-Olivier TAUBATY
c'est pas de moi, hélàs ...
Pas mal néanmoins.
--
Membre du Comité de Défense Révolutionnaire
de l'encre de chine et du pinceau en poils
de martre Kolinsky.
<http://mloiseau.free.fr/blog>
La Bete des Vosges (Francis Chartier)
2009-08-06 07:14:04 UTC
Permalink
Post by Pierre-Olivier TAUBATY
Je sens que je vais passer le document dans PAges, ça va pas tarder.
J'ai payé 2 versions d'Office (la v.X lorsque l'on est passé en MAc OS
X, et la 2008, mais je crois bien que c'est la dernière. J'ai beau les
avoir payé le prix "éduc" pour la première, et "famille" pour la
dernière, c'est encore trop cher payé pour un truc qui n'est pas foutu
de faire un remplacement basique sans planter.
Essayez peut-être avec OpenOffice ?
--
La Bête des Vosges
Pierre-Olivier TAUBATY
2009-08-06 14:14:14 UTC
Permalink
Post by La Bete des Vosges (Francis Chartier)
Post by Pierre-Olivier TAUBATY
Je sens que je vais passer le document dans PAges, ça va pas tarder.
J'ai payé 2 versions d'Office (la v.X lorsque l'on est passé en MAc OS
X, et la 2008, mais je crois bien que c'est la dernière. J'ai beau les
avoir payé le prix "éduc" pour la première, et "famille" pour la
dernière, c'est encore trop cher payé pour un truc qui n'est pas foutu
de faire un remplacement basique sans planter.
Essayez peut-être avec OpenOffice ?
Je suis passé sous Pages qui, lui effectue le remplacement sans
coup-férir.

Gros défaut de Pages, cependant, c'est que lorsqu'on lui demande de
mémoriser un mot inconnu (typiquement un nom propre, commençant par une
majuscule), il continue à l'indiquer comme non reconnu, qu moyen du
soulignement rouge en pointillé gras, même s'il ne s'arrête plus dessus
lors de la vérification. C'est chiant au niveau de l'affichage. Faut
peut-être que j'approfondisse un peu plus les préférences.

Petit apparté : La reconnaissance de caractères est très rapide et très
fiable avec Acrobat. Mais si certains d'entre vous pratiquent, qu'y a
t'il d'autre comme appli d'OCR performante sur Mac ?

Il me semble qu'Omnipage est franchement à la traîne sur Mac par rapport
aux spécifications de la version PC-Windows. J'ai "récupéré" une version
aux fins d'essai, mais j'ai l'impression que c'est un vieux truc
(l'installeur date de 2003). Et franchement, ça m'a pas convaincu.

Je cherchais ailleurs, qu'Acrobat, car il y a quand même un ou deux bugs
qui traînent.
--
PO.

Pour m'écrire : po_taubaty(arobas)yahoo(point)fr
Jean-Marie Schwartz
2009-08-07 07:43:21 UTC
Permalink
Vous lisez mes messages et vous faites bien. Le 6/08/09 16:14,
Post by Pierre-Olivier TAUBATY
Petit apparté : La reconnaissance de caractères est très rapide et très
fiable avec Acrobat. Mais si certains d'entre vous pratiquent, qu'y a
t'il d'autre comme appli d'OCR performante sur Mac ?
Il me semble qu'Omnipage est franchement à la traîne sur Mac par rapport
aux spécifications de la version PC-Windows. J'ai "récupéré" une version
aux fins d'essai, mais j'ai l'impression que c'est un vieux truc
(l'installeur date de 2003). Et franchement, ça m'a pas convaincu.
Pour l'instant, j'en suis toujours à Omnipage parce que moi, il me convainc.
Ceci dit, ils ont lâchement abandonné le développement de la version Mac il
y a plusieurs années.

Autrement, je crois que sur Mac le leader de l'OCR est le petit belge
Readiris, mais chose surprenante, c'est moi qui n'ai pas été convaincu par
un essai perso :-/
--
Jean-Marie Schwartz

« Je suis le fils de l'homme invisible, je n'ai jamais vu papa » (Sttellla)
Anne G
2009-08-03 23:58:59 UTC
Permalink
Post by Pierre-Olivier TAUBATY
Bonjour à tous,
Je tiens à préciser que je ne suis nullement impliqué
professionnellement dans la P.A.O.
Voila, je suis en train de numériser certains de mes livres. La
numérisation et l'OCR se passent sans trop de problèmes.
Le petit soucis concerne un caractère un peu particulier, c'est le tiret
des dialogues. Il s'agit d'un grand tiret. Or, bien sûr l'OCR me le
remplace par le petit tiret standard classique.
Ce tiret de dialogue a t'il un nom particulier, Comment l'obtenir ? Souw
Word ou Pages.
Merci à ceux qui me feront partager leurs lumières.
Bonne journée à tous.
Ils s’appellent EN-DASH (le court :–) [unicode 2013 UTF8 E2 80 93] et
EM-DASH (le long : —) [unicode 2014 UTF8 E2 80 94].

Tu les trouvera sous la rubrique «ponctuation» de «palette de
caractères» (chez moi‚ dans le menu - en-dessous de mon choix de clavier.)
Pierre-Olivier TAUBATY
2009-08-04 08:11:04 UTC
Permalink
Post by Pierre-Olivier TAUBATY
Bonjour à tous,
Je tiens à préciser que je ne suis nullement impliqué
professionnellement dans la P.A.O.
Voila, je suis en train de numériser certains de mes livres. La
numérisation et l'OCR se passent sans trop de problèmes.
Le petit soucis concerne un caractère un peu particulier, c'est le tiret
des dialogues. Il s'agit d'un grand tiret. Or, bien sûr l'OCR me le
remplace par le petit tiret standard classique.
Ce tiret de dialogue a t'il un nom particulier, Comment l'obtenir ? Souw
Word ou Pages.
Merci à ceux qui me feront partager leurs lumières.
Bonne journée à tous.
Ils s'appellent EN-DASH (le court :–) [unicode 2013 UTF8 E2 80 93] et
EM-DASH (le long : —) [unicode 2014 UTF8 E2 80 94].
Tu les trouvera sous la rubrique «ponctuation» de «palette de
caractères» (chez moi' dans le menu - en-dessous de mon choix de clavier.)
mille mercis. j'avais effectivement regardé la palette de caractère,
mais sans avoir eu l'idée d'aller voir la rubrique ponctuation.
--
PO.

Pour m'écrire : po_taubaty(arobas)yahoo(point)fr
Continuer la lecture sur narkive:
Loading...