Pour les généticiens du monde entier, Excel est un vrai cauchemar. Le logiciel est à l'origine d'un nombre important d'erreurs, car il convertit les noms de certains gènes, comme "MARCH1" en dates (1-Mar). Environ une publication scientifique sur 5 en fait les frais, et la solution la plus simple a donc consisté à renommer des dizaines de gènes.
Commentaires préférés (3)
Il suffit juste de modifier le format de la colonne, de la ligne voire de la cellule excel concernés en "Texte" en lieu et place du format "standard" voire "date".
Un simple paramétrage aurait évité de renommer des gènes. C'est ce changement qui est un cauchemar et pas Excel qui doit être utilisé correctement.
Je trouve flippant qu’un pan entier de la recherche scientifique soit obligé de se réformer à cause de Microsoft.
Ensuite, il faut bien comprendre que produire de la donnée et l'analyser ce n'est pas du la même chose, et c'est réalisé par des profils très différents. Les producteurs de données sont assez rarement scientifiques d'ailleurs : infirmiers, sociologues, administrations, transporteurs, etc. Et quand t'es scientifique, ben tu bosses avec les données que tu as, et tu as rarement le luxe (temps et/ou financement) de tout vérifier et modifier manuellement. Sans compter que le rendu de tes résultats est presque toujours imposé comme étant compatible avec Excel pour publication, relecture, réutilisation, etc. parce que c'est effectivement bien plus partageable qu'un dump de base de données.
Et donc quand Excel t'es imposé à la majorité des étapes de tes travaux, il ne « suffit » pas d'utiliser autre chose, merci d'éviter ce genre de condescendance.
Tous les commentaires (74)
Est-ce impossible de supprimer la conversion implicite et de la faire uniquement lorsque cela est désiré ?
Idem pour des nombres écrit en hexa !
Par exemple la valeur hexa 1E001 sera considéré comme étant égale à 10 au lieu de 122881
Il suffit juste de modifier le format de la colonne, de la ligne voire de la cellule excel concernés en "Texte" en lieu et place du format "standard" voire "date".
Un simple paramétrage aurait évité de renommer des gènes. C'est ce changement qui est un cauchemar et pas Excel qui doit être utilisé correctement.
Je trouve flippant qu’un pan entier de la recherche scientifique soit obligé de se réformer à cause de Microsoft.
www.google.fr/search?q=alternative+Excel
Voilà comment résoudre tous les problèmes indiqués dans la première source :Quelqu’un qui se plaint qu’il n’arrive pas à faire sa compta correctement avec Paint, je lui répondrai qu’il est débile et qu’il doit utiliser autre chose. Là c’est pareil.
Excel ça reste un logiciel généraliste. Il permets de faire plein de choses, mais moyennement bien. Dans beaucoup de situations ça suffit, mais dès fois non. Dans ce cas il faut trouver autre chose de plus spécifique.
Comme je l’ai indiqué, les alternatives à Excel c’est pas ce qui manque. Il y en a littéralement des centaines.
Mais plus je travaille et plus je me rend compte que le besoin en formation informatique est un secteur d’avenir ;)
Par contre, aucune idée de comment sont traitées les saisies dans ce cas précis...donc ça ne doit probablement pas marcher pour cette application.
Par exemple, quand je tapais 0012344 pour une référence précise, Excel m’ôtais systématiquement les deux premiers zéro alors qu’il me les fallait absolument.
Peu importe le format choisi, ça ne changeait rien.
Avec l’apostrophe, problème résolu si je filtre, mes deux zéros apparaissent et sans l’apostrophe,!
Ensuite, il faut bien comprendre que produire de la donnée et l'analyser ce n'est pas du la même chose, et c'est réalisé par des profils très différents. Les producteurs de données sont assez rarement scientifiques d'ailleurs : infirmiers, sociologues, administrations, transporteurs, etc. Et quand t'es scientifique, ben tu bosses avec les données que tu as, et tu as rarement le luxe (temps et/ou financement) de tout vérifier et modifier manuellement. Sans compter que le rendu de tes résultats est presque toujours imposé comme étant compatible avec Excel pour publication, relecture, réutilisation, etc. parce que c'est effectivement bien plus partageable qu'un dump de base de données.
Et donc quand Excel t'es imposé à la majorité des étapes de tes travaux, il ne « suffit » pas d'utiliser autre chose, merci d'éviter ce genre de condescendance.
Excel est polyvalent, adaptable a de nombreux cas d'utilisation etc... Mais je te rejoins à 100%, d'autant plus qu'on peut se former a Python sans trop de difficulté via internet.
- Que je sois bien clair : je ne dis pas qu’Excel c’est nul. Mais je maintiens qu’il est généraliste, et ne peut pas tout faire bien, même avec des fonctions avancées comme les macros ou les cubes. Dans la plupart des cas c’est suffisant, mais dès fois non.
- L’open data propose souvent plusieurs formats, dont le CSV qui est présent quasiment partout. Comme tout format il ses avantages et ses limites, mais dans la plupart des cas ça suffit.
- Je pense qu’imposer Excel pour certaines tâches c’est un vrai problème. On devrait utiliser des formats interopérables. Ensuite chacun choisit le logiciel qui lui convient le mieux. techniquement ça ne pose pas de problème. Mais il y a des blocages politiques et idéologiques (et financiers aussi).
Par contre t’as soulevé un point important auquel je n’avais pas pensé : les gens qui traitent les données ne sont pas forcément ceux qui les génèrent. Si on peut demander aux gens qui traitent les données d’utiliser Python, ou R, ou je sais pas quoi de mieux adapteé à la génétique, on ne peut pas demander la même chose à un infirmier. Ça peut être la source de certains problèmes.
Ce qui m’attriste c’est qu’on doive modifier la science pour la rendre compatible avec Excel, plutôt que de faire l’inverse.
Le plus simple est aussi de taper par exemple 'MARCH5 avec une apostrophe en début de champ pour forcer le format text simple.
Forcer en texte une cellule est très simple, et c'est aussi basic de faire ce forçage à l'import de sources étrangères (txt, csv,...).
Le choix de l'outil n'est pas le souci, utiliser d'autres outils lui révèlerait d'autres faux "problèmes"
Je pense qu'elle se résume plutôt à : Quel est le coup et les conséquences des corrections et des effets induits de toutes les erreurs d'inattention et oublis qui conduisent à toutes ces erreurs dans les publications ?
Si ils ont renommé ces gènes, c'est qu'ils ont du conclure après de nombreuses années que c'était comme se battre contre des moulins à vent et donc ils ont préféré changer....
En même temps des pro qui ne sont pas sous Mac ....
Lol
J'aimerais aussi beaucoup connaître le rapport entre "être un professionnel" et "être sous mac".
Cet article explique un peu mieux le problème : www.numerama.com/sciences/641575-il-etait-plus-simple-de-renommer-des-genes-humains-que-de-mettre-a-jour-excel.html
Ce n'est pas 1 ou 2 gênes qui posent problème mais une vingtaine ayant des noms pouvant se transformer en date. Comme la nomenclature des gênes n'est pas si compliqué à changer et que le risque d'erreur est bien trop grand, il est plus simple de changer la nomenclature que de mettre à jour Excel ou trifouiller les données.