Deutsch   English   Français   Italiano  
<listes-20231128133915@ram.dialup.fu-berlin.de>

View for Bookmarking (what is this?)
Look up another Usenet article

Path: ...!3.eu.feeder.erje.net!feeder.erje.net!proxad.net!feeder1-2.proxad.net!usenet-fr.net!news.trigofacile.com!fu-berlin.de!uni-berlin.de!not-for-mail
From: ram@zedat.fu-berlin.de (Stefan Ram)
Newsgroups: fr.comp.lang.python
Subject: Re: =?UTF-8?Q?Dictionnaire_des_mots_fran=C3=A7ais=2E?=
Date: 28 Nov 2023 12:39:58 GMT
Organization: Stefan Ram
Lines: 18
Expires: 1 Dec 2024 11:59:58 GMT
Message-ID: <listes-20231128133915@ram.dialup.fu-berlin.de>
References: <ujhqe8$opll$1@dont-email.me>
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
X-Trace: news.uni-berlin.de cOc5URRtSQlqyHmfR+UTxgu7EVwZXTlReFgx9R5UT3Z844
Cancel-Lock: sha1:7ka6QLUMwwVGxo5bzOa4QlLMA7o= sha256:PjtbbA3T6bfdEnfgdWKMGECF7eBD6AwfzEIXwqk/nvQ=
X-Copyright: (C) Copyright 2023 Stefan Ram. All rights reserved.
	Distribution through any means other than regular usenet
	channels is forbidden. It is forbidden to publish this
	article in the Web, to change URIs of this article into links,
        and to transfer the body without this notice, but quotations
        of parts in other Usenet posts are allowed.
X-No-Archive: Yes
Archive: no
X-No-Archive-Readme: "X-No-Archive" is set, because this prevents some
	services to mirror the article in the web. But the article may
	be kept on a Usenet archive server with only NNTP access.
X-No-Html: yes
Content-Language: fr-FR
Accept-Language: de-DE-1901, en-US, it, fr-FR
Bytes: 2396

Dominique <zzz@aol.com> writes:
>Savez-vous où je pourrais trouver une liste des mots français au format 
>texte ou csv ?

  Vous pouvez trouver de tels fichiers sur Internet en recherchant,
  à l'aide d'un moteur de recherche, des textes contenant plusieurs
  mots ensemble qui n'apparaissent normalement pas ensemble dans un
  texte. Prenez par exemple "Ablation", "Accoutrement" et "Adept".

  Toutefois, cette méthode ne permet généralement de trouver que les
  formes de base des mots, et non les formes fléchies. Pour obtenir
  une liste de toutes les formes de mots, une possibilité serait de
  rassembler des textes français et d'extraire ensuite les formes de
  mots avec Python. Cependant, même de cette manière, on trouvera des
  mots erronés (comme des fautes de frappe ou des mots étrangers),
  qui devront ensuite être supprimés manuellement.