S'identifier - S'inscrire - Ecrire un article - Contact

Classer correctement les mots clés et les articles -- à moitié résolu

C'est pas évident, en fait

Par labosonic • Suggestions • Dimanche 15/07/2007 • 11 commentaires  • Lu 5270 fois • Version imprimable

Note : 3.2/5 (53 notes)

Mots-clés : , ,


Contrairement aux apparences, rien sur Viabloga ne peut être pour le moment classés dans l'ordre alphabétique. Tout est classé dans le bon vieil ordre Geek de la table ASCII qui correspond à l'ordre alphabétique anglo-saxon mais pas à l'ordre français (rapport à ce que notre langue est dotée de quelques subtilités du type : accents, trémas, etc ...).

Ce ne sont, à priori, que des détails qui paraissent mineurs mais ça peut être gênant. 3 exemples issus de Critico-Blog (où j'ai une grosse volumétrie de mot-clés (>100) et d'articles (>2500), donc où tous les cas limites apparaissent à l'usage.

Pour une liste d'articles :

- Je me trimballe régulièrement le ç à la fin :
Rien de bien méchant, c'est de l'ordre de l'événement marginal (~3 pour 2500, le ç apparaît en fin de liste , ça semble une convention un peu originale mais si rare ~ 1 % que ça ne choque personne).

- Je me trimballe une ordre alphabétique fantaisiste à cause des accents :
Là, c'est plus fréquent et je me retrouve avec Jérusalem coincé entre Juste et Kafka. C'est déjà moins drôle. (Surtout si je veux faire une liste alphabétique qui ait de la gueule avec une identation comme celle suggérée par Fix).

Pour une liste de mot-clès :

Stéphane a trouvé un subterfuge pour classer les textes dans le "vrai" ordre alphabétique : Virer les cédilles et les accents dans l'URL, classer les URL et remplacer les URLs sans caractères spéciaux par le titre du texte défini par l'utilisateur.

Ca règle le problème mais ça en crée d'autres :
- changer le titre d'un texte, ne change pas l'ordre alphabétique (ça peut aussi poser des soucis quand on gère des synonymes.)

Pour toutes les listes plus ou moins alphabétiques : 

Je me rend surtout compte que l'ordre alphabétique est un truc qu'on n'utilise jamais dans la "vraie" vie, parce qu'il est ennuyeux et que, même en français, il y a des trucs qui fonctionnent naturellement de droite à gauche : les chiffres.
Ce serait donc peut-être pas idiot de lui préférer l'ordre
alphanumérique.
Dans Critico-Blog : j
'ai 3 disques avec des titres purement numériques : 2112 , 25 & 3121, classés dans cet ordre (sic)

C'est désordre. Et dans une liste de mots-clés "fils" du type "tarif" avec un père appelé "Gamme de prix" le comportement des requêtes d'affichage des fils doit être catastrophique.

Peut être faudrait-il récupérer une moulinette du genre ASCII vers alphabet (qui doit bien exister, ça a d'un eexercice pour étudiant) pour remettre un peu toutes ces histoires de caractères spéciaux en ordre pour les articles ?
Il y aurait peut-être un truc à revoir aussi dans les classements alphabétiques de textes ?

Et aussi il faudrait éventuellement créer un distinguo (transparent pour l'utilisateur entre Mot-Clé et Chiffre-clé (un mot-clé purement composé de chiffre se trie différemment) et tant qu'à faire Date-clé (qui se posera irrémédiablement de la même manière).

Cette suggestion a été adoptée par 53 utilisateurs :

  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Fix :  
  • labosonic@critico-blog :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • leblase :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  
  • Visiteur :  

D'autres articles sur des thèmes similaires :

Les utilisateurs qui ont voté pour cette suggestion ont voté également pour :


Commentaires

Dates clés, base de données par Fix le Dimanche 15/07/2007 à 12:20

Fix Pour mon petit problème, j'ai besoin de dates-clés. Ou de quelque chose qui me fasse ceci "affiche moi tous les dessins commis entre octobre 1998 et janvier 2003", " avec tel personnage "," mais pas dans tel lieu".

La grammaire sur les dates doit être capable de traiter "1999","mars 1999","31 janvier 2000".

Ces dates sont-elles des mots-clés ? Pas si simple, comme dirait labosonic :-)

Dans mon cas, s'il fallait que je crée une par une les dates-clés aaaa mm jj, il y en aurait probablement entre 2000 et 3000 (pfff ... fatigué d'avance) pour écluser l'existant, plus au moins une dizaine par mois à venir.

Si ... VB était adossé à une base de données - ce qui n'est pas le cas, d'après ce que j'ai cru comprendre -, le problème serait ultra-simple.

On pourrait aussi imaginer que soit "précâblé" dans VB un système de dates-clés arborescent, du genre aaaa -> mm -> dd, comprenant toutes les dates entre ? et ?.

Base de données ? parce que, outre les dates, j'ai - toujours mon petit cas perso à haute volumétrie - un nombre immportant d'attributs (de champs, en langage bdd) à rattacher à une image.

Bref je me pose toujours la question de savoir si VB peut gérer mon truc. Je n'ai pas envie d'investir des centaines d'heures pour m'apercevoir que ça ne marche pas ou ne peut pas marcher.

VB est génial, c'est vrai. Il y existe des fonctionnalités introuvables ailleurs. On est facilement tenté de penser que puisque c'est génial ça va faire des étincelles, ou encore que puisque c'est génial ça peut l'être encore plus (... suggestions). Mais un truc génial ne fait pas forcément un outil de production stable, prévisible, connaissable dans tous ses recoins, etc.

Revenons aux bases de données. Un système de base de données "complétant" VB. Communiquant facilement (depuis, et vers) VB. Cela suppose sans doute des API (par ex. des "verbes gourous"). Ce serait extrêmement utile pour beaucoup d'usages. Cela permettrait par ex. d'utiliser complètement les "champs complémentaires" que l'on peut créer comme indiqué ici.

Des mots-clés VB + une base de données. Ouâââ. Super super puissant, et supersimple à utiliser. (@ Stéphane : je te raconte pas les clients que je peux te ramener avec ça :-) )

Comme a dit labosonic à plusieurs occasions , encore un truc de plus, comment piloter, une roadmap. Et j'ajoute : une stratégie. Une stratégie explicite, visible, discutée avec les utilisateurs. C'est quoi, VB ?












Re: Dates clés, base de données par Stephane le Dimanche 15/07/2007 à 15:45

Stephane Si tu fais un dessin = un article, le mieux est d'utiliser la date de l'article pour mettre la date du dessin.


Re: Dates clés, base de données par Fix le Dimanche 15/07/2007 à 17:55

Fix L'article présentant un dessin n'a pas forcément la date du dessin. Je peux vouloir "ressortir" un vieux dessin, avec un blablabla nouveau.

Et l'article ... peut présenter plusieurs dessins ! Et avoir ses propres mots-clés (indépendants, en quelque sorte, des dessins présentés, et relatifs au blablabla de l'article).

(Autrement dit, dans ma réflexion, j'essaie de séparer ce qui est blog, et ce qui est base de données. Une partie des fonctionnalités bdd peut être implémentée sur le blog, grâce aux mots-clés)

Ça fait plusieurs semaines que je réfléchis au truc, et je pense maintenant être presque décidé : j'ai besoin d'un identifiant unique par dessin. Ce sera la date (d'exécution du dessin) + un numéro d'ordre. Exemples d'identifiant :("=" et "*" sont des séparateurs)

2006=07=01*nnn la date est complète
2006=07=00*nnn je ne connais que le mois
2006=00=00*nnn je ne connais que l'année
0000=00=00*nnn je ne connais même pas l'année :-)

De tels identifiants devraient permettre des classements complets et faciliter des recherches.


Euh, question subsidiaire à Stéphane :  à quels séparateurs ai-je droit pour les noms / les titres des articles et des textes ?




Re: Dates clés, base de données par Stephane le Dimanche 15/07/2007 à 17:59

Stephane > Euh, question subsidiaire à Stéphane :  à quels séparateurs ai-je droit pour les noms / les titres des articles et des textes ?

Tous les séparateurs sont transformés en - (dans les identifiants, URLs etc.). Tu peux utiliser n'importe quoi. Pour les mots-clés, il vaut mieux éviter les virgules.


Re: Dates clés, base de données par Jean-Luc le Dimanche 15/07/2007 à 16:19

Jean-Luc Xavier, je te recommande l'échange que nous avions eu ici il y a un an avec OMG (de retour !). Comme quoi il y a des sujets récurrents, voire saisonniers ! Vois notamment l'appli qu'utilisait et développait OMG...


Re: Dates clés, base de données par Fix le Dimanche 15/07/2007 à 18:10

Fix merci ! et si on se voyait avec toi, OMG, (autres bienvenus) ? je pars de Paris le 20/7


Re: par labosonic le Dimanche 15/07/2007 à 15:35

Pour Critico-Blog, je ne traite que de listes où j'ai toujours de l'alphabétique et du numérique dans le champ titre de l'article. J'ai opté pour un formalisme : <$titre" - "$nom>, donc je n'en ai pas besoin. Puisque tout apparaît toujours alphabétique, il y a quelques désordres éventuels (ceux que j'ai souligné mais c'est marginal et je m'en accommode bien).

Par contre, dans l'usage que j'ai imaginé et décrit rapidement (avec des prix à classer), ça risquerait de poser problème si un utilisateur envisageait un truc comme ça. A mon avis, c'est le genre de truc qui ne manquera pas d'arriver et il me semble plus important de l'anticiper que de le trouver en face à face le jour où un utilisateur viendra avec une partie du boulot déjà fait et son problème sous le bras.

C'est pas une suggestion issue d'un besoin de ma part, mais d'un constat que ma grosse volumétrie a mis en évidence. Histoire d'avoir soit un tuto à proposer pour contourner le problème avant, soit une réponse claire "attention, tu risques de pas pouvoir le faire", soit une solution qui marche le jour où. 

Pour l'idée de date-clé, c'est autre chose. C'est l'archétype même de la solution qui est demandée par les utilisateurs parce qu'ils pensent qu'une date, c'est comme un chiffre et que c'est le même boulot alors que non. C'est déjà formalisé par la graphie et ça se classe assez naturellement en quantième du mois / mois / année avec un peu d'organisation et de réflexion en amont, on devrait réussir à faire tout ce qu'on veut avec, si on utilise des dates pour réaliser un archivage et qu'on exclut d'utiliser des chiffres pour autre chose.

Il doit suffire d'entrer chaque chiffre avec deux digits pour se dépétrer du souci : Remplacer le jour 5 du mois par le jour 05 ou même " 5" - espace 5) à un moment donné.

On peut le faire de manière automatique :
- au niveau de l'url (et pas forcément au niveau du titre qu'on peut laisser en 5) selon la méthode que tu utilises pour régler les problèmes d'accents dans les textes. En réalisant un test :
"Si père du mot-clé est Jour & Grand-Père est date alors traite le mot qui a l'air d'un chiffre comme un quantième de date et formate le sur deux digits" 

Ou plus simplement, faire une fiche cuisine style tuto qui explique les précautions à utiliser à la saisie :
- Comment organiser le bazar pour que ça marche ?
- Les limites de l'exerice : Si vous utilisez une classification par date, vous mettez des chiffres en mot-clés et ne devez pas en utiliser ailleurs pour une quelconque autre raison (sinon vous mélangerez des quantièmes du mois et les chiffres de votre année avec les chiffres que vous créez par ailleurs) ou alors à vos risques et périls.
- En profiter pour dire que Viabloga ne gère pas dans ce cas l'événement "date" à proprement parler avec ses mot-clés et qu'il n'est pas possible de créer des listes de mot-clés liées à la date du jour de la requête.

En gros, expliquer que VB ne peut pas créer des requêtes du style : "afficher tous les articles avec n jours d'avance/de retard par rapport au jour de la requête datée via la structure de donnée que l'utilisateur a crée". Et qu'il ne faut pas confondre ça avec le .jour(n).


Re: par Stephane le Dimanche 15/07/2007 à 15:54

Stephane Ca me paraît très lourd d'utiliser des mots-clés pour identifier des dates (à part les années éventuellement). La meilleure solution, c'est d'utiliser la date de l'article, et ainsi pouvoir profiter des classements par date etc.

Le problème c'est qu'il faut alors choisir entre dater un livre, ou sa critique. Suivant les cas, il n'y a besoin que d'une seule date (les dessins de Fix).


par Stephane le Dimanche 15/07/2007 à 15:19

Stephane

Contrairement aux apparences, rien sur Viabloga ne peut être pour le moment classés dans l'ordre alphabétique.

En fait non, normalement, tout est trié par ordre alphabétique français, sauf les tables dynamiques où le tri est fait en Javascript par le navigateur. Je viens de changer la fonction de tri pour qu'elle trie suivant la langue définie par le système. (il faut un navigateur et/ou un système en français donc -- ne pas oublier de faire Ctrl+Shift+R pour rafraîchir le cache sur FF) :

Je vous aime tant - Alain Serres & Olivier Tallec
Je, François Villon - Jean Teulé
Jérusalem d'Afrique (Le Chat du Rabbin : Tome 5) - Joann Sfar
J'étais derrière toi - Nicolas Fargue
Jeune fille - Anne Wiazemsky
J'habite dans la télévision - Chloé Delaume
Joe Cool déteste le dimanche après-midi (Peanuts tome 1) - Charles M. Schultz

Le traitement des apostrophes est bizarre, mais bon, c'est plus compréhensible qu'avant.


Re: par labosonic le Dimanche 15/07/2007 à 15:39

Cool :D



Session

Pour participer plus facilement, ouvrez une session :

Identifiant de
mon blog
Nom d'utilisateur
Mot de passe

Si vous avez déjà un blog sur ViaBloga ou si vous avez ouvert un compte sur l'un d'entre eux, vous pouvez vous identifier avec votre nom d'utilisateur et mot de passe en précisant d'abord l'identifiant de votre blog.

S'inscrire

Discussions actives (+ commentaire)


Archives par mois