Path: ...!3.eu.feeder.erje.net!feeder.erje.net!proxad.net!feeder1-2.proxad.net!usenet-fr.net!news.trigofacile.com!fu-berlin.de!uni-berlin.de!not-for-mail From: ram@zedat.fu-berlin.de (Stefan Ram) Newsgroups: fr.comp.lang.python Subject: Re: =?UTF-8?Q?Dictionnaire_des_mots_fran=C3=A7ais=2E?= Date: 28 Nov 2023 12:39:58 GMT Organization: Stefan Ram Lines: 18 Expires: 1 Dec 2024 11:59:58 GMT Message-ID: References: Mime-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit X-Trace: news.uni-berlin.de cOc5URRtSQlqyHmfR+UTxgu7EVwZXTlReFgx9R5UT3Z844 Cancel-Lock: sha1:7ka6QLUMwwVGxo5bzOa4QlLMA7o= sha256:PjtbbA3T6bfdEnfgdWKMGECF7eBD6AwfzEIXwqk/nvQ= X-Copyright: (C) Copyright 2023 Stefan Ram. All rights reserved. Distribution through any means other than regular usenet channels is forbidden. It is forbidden to publish this article in the Web, to change URIs of this article into links, and to transfer the body without this notice, but quotations of parts in other Usenet posts are allowed. X-No-Archive: Yes Archive: no X-No-Archive-Readme: "X-No-Archive" is set, because this prevents some services to mirror the article in the web. But the article may be kept on a Usenet archive server with only NNTP access. X-No-Html: yes Content-Language: fr-FR Accept-Language: de-DE-1901, en-US, it, fr-FR Bytes: 2396 Dominique writes: >Savez-vous où je pourrais trouver une liste des mots français au format >texte ou csv ? Vous pouvez trouver de tels fichiers sur Internet en recherchant, à l'aide d'un moteur de recherche, des textes contenant plusieurs mots ensemble qui n'apparaissent normalement pas ensemble dans un texte. Prenez par exemple "Ablation", "Accoutrement" et "Adept". Toutefois, cette méthode ne permet généralement de trouver que les formes de base des mots, et non les formes fléchies. Pour obtenir une liste de toutes les formes de mots, une possibilité serait de rassembler des textes français et d'extraire ensuite les formes de mots avec Python. Cependant, même de cette manière, on trouvera des mots erronés (comme des fautes de frappe ou des mots étrangers), qui devront ensuite être supprimés manuellement.