Fantasque Time Line Index du Forum Fantasque Time Line
1940 - La France continue la guerre
 
 FAQFAQ   RechercherRechercher   Liste des MembresListe des Membres   Groupes d'utilisateursGroupes d'utilisateurs   S'enregistrerS'enregistrer 
 ProfilProfil   Se connecter pour vérifier ses messages privésSe connecter pour vérifier ses messages privés   ConnexionConnexion 

Glossaire pour la FTL

 
Poster un nouveau sujet   Répondre au sujet    Fantasque Time Line Index du Forum -> Le site
Voir le sujet précédent :: Voir le sujet suivant  
Auteur Message
sting01



Inscrit le: 30 Juil 2010
Messages: 1450
Localisation: Thailande

MessagePosté le: Jeu Déc 23, 2010 00:52    Sujet du message: Glossaire pour la FTL Répondre en citant

Note de Loïc : sujet séparé de Résistance dans les Balkans, chrono 1941

Serait il possible d'avoir un Glossaire a la fin du livre et en annex du site (ordre alphabetique et exhaustif) des personnages apparaissant?

Cela est courant pour les livres traitant d'histoire alternatives , au moins pour les anglo saxons.

Travail titanesque s'y il en est, mais qui pourrait demontrer la somme des recherches et la qulite des dites recherches aux yeux des pisses vinaigres qui ne manquent pas!
_________________
La can can-can, cancouillote,
c'est pas fait pour les francois.

Anscarides je suis ne,
heritier de la Comte je serai.
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
patzekiller



Inscrit le: 17 Oct 2006
Messages: 3940
Localisation: I'am back

MessagePosté le: Jeu Déc 23, 2010 08:49    Sujet du message: Répondre en citant

à mon avis les pisse vinaigres s'arreteront au fait que tel ou tel personnage ne portait pas de boutons de manchette dorés ou argentés, alors le glossaire...
mais l'idée en soit n'est pas mauvaise, reste à voir si elle est faisable...
_________________
www.strategikon.info
www.frogofwar.org
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
Cornelis



Inscrit le: 17 Oct 2006
Messages: 77
Localisation: Guéret (Creuse)

MessagePosté le: Jeu Déc 23, 2010 10:23    Sujet du message: Répondre en citant

Ce que vous dites me fait penser à quelque chose, en cours dans le domaine des digital humanities (V.O. des "technologies de l'information et de la communication appliquées aux sciences humaines"), avec l'encodage des textes en langage XML, selon une DTD dite TEI (Text Encoded Initiative) qui permet de repérer dans les textes des entrées à indexer selon des index choisis par l'utilisateur. On pourrait imaginer encoder le texte avec des balises <persname> pour les noms de personne, <matname> pour les matériels, <geogname> pour les lieux, voire <unitname> pour les unités, etc. Mais ça suppose un travail considérable néanmoins et ça ne donne que des index pas des notices sur chaque entrée. L'avantage sur les systèmes d'indexation traditionnels type Word, c'est une beaucoup plus grande interopérabilité et surtout une adaptation à chaque type d'index demandé.

Personnellement, je ne connais l'usage que sur des textes du moyen Âge, plus courts heureusement !
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
Capitaine caverne



Inscrit le: 11 Avr 2009
Messages: 4119
Localisation: Tours

MessagePosté le: Jeu Déc 23, 2010 10:24    Sujet du message: Répondre en citant

L'idée du glossaire est excellente car elle permettra au lecteur de savoir de qui on parle, de ou a lieu l'action, de quelles unités ou institutions il est question, etc..... Car en dehors de quelques grosses pointures, les noms des personnes, lieux, ...sont en général mal connus (au mieux!) des français, voir pas du tout connus. Et cela ne vaut pas seulement pour les Balkans, mais pour l'ensemble des théatres et intervenants du conflit.
_________________
"La véritable obscénité ne réside pas dans les mots crus et la pornographie, mais dans la façon dont la société, les institutions, la bonne moralité masquent leur violence coercitive sous des dehors de fausse vertu" .Lenny Bruce.
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
patzekiller



Inscrit le: 17 Oct 2006
Messages: 3940
Localisation: I'am back

MessagePosté le: Jeu Déc 23, 2010 12:38    Sujet du message: Répondre en citant

ça aura aussi une utilité pour les relecteurs, avec pourquoi pas une borne "unités". maintenant c'est facile de dire yapluka, mais il faut ce qui nous manque toujours le plus à nous : le temps (pour le faire)
_________________
www.strategikon.info
www.frogofwar.org
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
sting01



Inscrit le: 30 Juil 2010
Messages: 1450
Localisation: Thailande

MessagePosté le: Jeu Déc 23, 2010 13:29    Sujet du message: Répondre en citant

Cornelis a écrit:
Ce que vous dites me fait penser à quelque chose, en cours dans le domaine des digital humanities (V.O. des "technologies de l'information et de la communication appliquées aux sciences humaines"), avec l'encodage des textes en langage XML, selon une DTD dite TEI (Text Encoded Initiative) qui permet de repérer dans les textes des entrées à indexer selon des index choisis par l'utilisateur. On pourrait imaginer encoder le texte avec des balises <persname> pour les noms de personne, <matname> pour les matériels, <geogname> pour les lieux, voire <unitname> pour les unités, etc. Mais ça suppose un travail considérable néanmoins et ça ne donne que des index pas des notices sur chaque entrée. L'avantage sur les systèmes d'indexation traditionnels type Word, c'est une beaucoup plus grande interopérabilité et surtout une adaptation à chaque type d'index demandé.

Personnellement, je ne connais l'usage que sur des textes du moyen Âge, plus courts heureusement !



DTD, c'etait deja vieux lorsque j'etais jeune ...

Mais l'idee d'utiliser XML + (he oui soyons fou, pourquoi pas) XSLT est tout a fait faisable.

Au cas cette soution est retenue, je serais pret a me porter volontaire pour la mission. C'est mon metier, c'est comment je paye ma villa, c'est pourquoi mon patron me paye (trop?).

je ne crois pas que le travail lui meme pourrait etre tres difficile, on pourrais meme imaginer l'utilisation de RegEx (back reference , recusivite des recherches sur plusieur niveaux); On pourrait aussi imaginer utilise une DB, avec des recherches 'full text' avancees .......... en mode recursifs. une tell approche 'automatique' devrait permettre de recuperer environ 70% des occurences.

Je devrais etre a meme de faire certains test dans un avenir tres proche (cela se recoupant avec les travaux preparatoires que je suiis en train de faire pour ma companie, donc l'etablissement des tests pourrait etre fait durant mes heures de travail sans pour autant leser mes employeurs, un fichier texte etant un fichier texte , le contenu n'ayant pas d'importance en lui meme).

Donc JE SUIS VOLONTAIRE MON ADJUDANT.

Petit point de detail (bouton de guetre jaune au lieu d'etre blanc) il n'existe pas d'encodage XML; XML est une presentation de data suivant des regles syntaxiques tres precises (anciennement les dites regles etait formule dans un document independant, DTD, amis cela est obsolete depuis une bonne dizaine d'annees).
C'est pourquoi XSL and XSLT (similaire au css pour HTML) sont interressant, cela procure une mutation arbitraire de la dite presentation (conversion de xml en html or Xhtml) sous recour au DOM (appendChild) ou javascript (document.getElementById('').innerHtml) par le biais d'un sofware nativement integre dans les browsers depuis 2001 au plus tard (IE6+, Netscape 6 +, Opera7+, Safari3+ ....). Tres rapide et tres maniable.
_________________
La can can-can, cancouillote,
c'est pas fait pour les francois.

Anscarides je suis ne,
heritier de la Comte je serai.
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
loic
Administrateur - Site Admin


Inscrit le: 16 Oct 2006
Messages: 8936
Localisation: Toulouse (à peu près)

MessagePosté le: Jeu Déc 23, 2010 14:47    Sujet du message: Répondre en citant

J'ai donc séparé ce sujet.

Bon, plus concrètement ... Il y a ici plusieurs difficultés :
- la nouvelle version de la chrono est stockée dans un blog sous Wordpress, mais une partie de l'ancien site est encore au format HTML.
- le moteur de recherche n'est pas encore réimplémenté sur la version blog
- le T2 est pour le moment sous la forme de fichiers Word

Alors pour le moment, je ne vois pas trop comment gérer l'idée d'un glossaire, par ailleurs excellente.
_________________
On ne trébuche pas deux fois sur la même pierre (proverbe oriental)
En principe (moi) ...
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
Menon-Marec



Inscrit le: 27 Mai 2008
Messages: 225
Localisation: Paris

MessagePosté le: Jeu Déc 23, 2010 15:10    Sujet du message: Répondre en citant

Avis à la population!
Notre livre est toujours en pile sur le présentoir 2de Guerre mondiale à la FNAC Montparnasse: la responsable du rayon m'a dit qu'elle ne cessait pas d'en recommander de nouveaux exemplaires car ils partent comme des petits pains. C'est, apparemment, un cadeau très apprécié (par et pour les connaisseurs, et par et pour les autres).
Nous sommes, je ne crains pas de l'affirmer, les meilleurs!
Joyeux Noël à tous!
Amts.
M-M.
PS pour Loïc: je ne savais pas trop où glisser ce post. Alors, ici ou ailleurs... Laughing
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
loic
Administrateur - Site Admin


Inscrit le: 16 Oct 2006
Messages: 8936
Localisation: Toulouse (à peu près)

MessagePosté le: Jeu Déc 23, 2010 16:07    Sujet du message: Répondre en citant

Menon-Marec a écrit:

PS pour Loïc: je ne savais pas trop où glisser ce post. Alors, ici ou ailleurs... Laughing

Eh bien, ici par exemple ! Twisted Evil
Je te laisse le déplacer.
_________________
On ne trébuche pas deux fois sur la même pierre (proverbe oriental)
En principe (moi) ...
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
Menon-Marec



Inscrit le: 27 Mai 2008
Messages: 225
Localisation: Paris

MessagePosté le: Jeu Déc 23, 2010 16:49    Sujet du message: Répondre en citant

Je sais pas déplacer un post... Embarassed
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
loic
Administrateur - Site Admin


Inscrit le: 16 Oct 2006
Messages: 8936
Localisation: Toulouse (à peu près)

MessagePosté le: Jeu Déc 23, 2010 17:04    Sujet du message: Répondre en citant

Ben, un simple copier/coller puis effacement de celui-ci Je m'incline devant votre grandeur
_________________
On ne trébuche pas deux fois sur la même pierre (proverbe oriental)
En principe (moi) ...
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
Cornelis



Inscrit le: 17 Oct 2006
Messages: 77
Localisation: Guéret (Creuse)

MessagePosté le: Jeu Déc 23, 2010 18:05    Sujet du message: Répondre en citant

Bonsoir

Merci de m'avoir fait mettre le doigt sur une imprécision de ma part, le TEI n'est pas une DTD (à la différence de l'EAD plus connue des archivistes), ni même un schéma, mais un ensemble de différents schémas et DTD, dont seule une part est commune, le reste étant librement définissable par l'utilisateur.
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
sting01



Inscrit le: 30 Juil 2010
Messages: 1450
Localisation: Thailande

MessagePosté le: Ven Déc 24, 2010 00:10    Sujet du message: Répondre en citant

loic a écrit:
J'ai donc séparé ce sujet.

Bon, plus concrètement ... Il y a ici plusieurs difficultés :
- la nouvelle version de la chrono est stockée dans un blog sous Wordpress, mais une partie de l'ancien site est encore au format HTML.
- le moteur de recherche n'est pas encore réimplémenté sur la version blog
- le T2 est pour le moment sous la forme de fichiers Word

Alors pour le moment, je ne vois pas trop comment gérer l'idée d'un glossaire, par ailleurs excellente.


Serais t'il possible d'avoir une archive RAR ou Gzip (tu peut generer cette derniere automiquement avec une ligne de commande sur le serveur).

Format wordpress, HTML, Word, tout cela est facilement exportable en .txt. A ce moment la, la manip est de trouver les mots qui nous interressent pour les rubriques recherchees (Nom, geo location, unites ...) et de construire une DB de ces noms.

Et alors, on construit 3 parsers (1 par format utilise) qui va 'marquer' les dits mots (xml pour wordpress et html, quelque chose d'autre pour word), et extraire le positionement (De Gaulle page 1, 5 , 75 ....).

Les chose importantes :

Plus le fichier est gros, mieux c'est ( statistiques, facilite de construire un parser)

LE temps consacre (ce n'est pas complique, mais c'est long a mettre en place)

Le besoin d'une verification manuelle a posteriori

Decider des le depart de ce que nous voulons (un glossaire pour le version en ligne, en glossaire pour la version papier, un glossaire pour les deux? Devrait il etre exhaustif (toutes les occurences de de Gaulle?) .... )

Comme toujours, desole pour les fautes de frappes, 5 am, je dois merendre au bureau en urgence, pas l'esprit tres en place.
_________________
La can can-can, cancouillote,
c'est pas fait pour les francois.

Anscarides je suis ne,
heritier de la Comte je serai.
Revenir en haut de page
Voir le profil de l'utilisateur Envoyer un message privé
Montrer les messages depuis:   
Poster un nouveau sujet   Répondre au sujet    Fantasque Time Line Index du Forum -> Le site Toutes les heures sont au format GMT + 1 Heure
Page 1 sur 1

 
Sauter vers:  
Vous ne pouvez pas poster de nouveaux sujets dans ce forum
Vous ne pouvez pas répondre aux sujets dans ce forum
Vous ne pouvez pas éditer vos messages dans ce forum
Vous ne pouvez pas supprimer vos messages dans ce forum
Vous ne pouvez pas voter dans les sondages de ce forum


Powered by phpBB © 2001, 2005 phpBB Group
Traduction par : phpBB-fr.com