Path: ...!2.eu.feeder.erje.net!feeder.erje.net!proxad.net!feeder1-2.proxad.net!usenet-fr.net!pasdenom.info!.POSTED.2a01:e0a:d58:7a0:9066:68db:6719:2763!not-for-mail From: "Sh. Mandrake" Newsgroups: fr.lettres.langue.francaise Subject: Re: Petite statistique Date: Tue, 16 Jan 2024 21:50:33 +0100 Organization: Message-ID: References: MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Injection-Date: Tue, 16 Jan 2024 20:50:34 -0000 (UTC) Injection-Info: rasp.pasdenom.info; posting-account="bcda-free@usenet"; posting-host="2a01:e0a:d58:7a0:9066:68db:6719:2763"; logging-data="21802"; mail-complaints-to="abuse@pasdenom.info" User-Agent: Mozilla Thunderbird Cancel-Lock: sha1:OqzjcSNei19T3ZiUQKta4T2tbSk= sha256:Oeoj3d76zfULboUWqSdpGjPn72E6HMTEsSLZDv7Q3Z8= sha1:84Ny9+37kS1Jsp7crCpE/LHrCZk= sha256:qvL4UKfPet/+IIOGbBBFu80bLQ5SrdXfKhdPKdfEpNM= Content-Language: fr In-Reply-To: Bytes: 2589 Lines: 32 Le 16/01/2024 21:33:07, par la barbe du Prophète, ram@zedat.fu-berlin.de (Stefan Ram) a écrit : > Je viens d'écrire un petit programme de statistiques qui évalue la > fréquence des mots dans les messages de ce newsgroup au cours des > dernières années. (Afin d'exclure les messages spam en anglais, je > n'ai pris en compte pour l'instant que les posts de certains noms > d'expéditeurs réguliers). > > La particularité de mon programme est qu'il prend également > en compte les signes de ponctuation, les combinaisons de > plusieurs mots (Par exemple : « 9492 'de la' », voir plus bas) > ainsi que les combinaisons de plusieurs signes de ponctuation > (Par exemple : « 5661 '".' », voir plus bas). > > C'est utile pour l'apprentissage du français, car cela permet de > savoir quelles expressions sont particulièrement fréquentes et > valent donc la peine d'être apprises. > > (Le programme distingue les majuscules et les minuscules, donc > « vous » et « Vous » sont considérés comme deux mots différents. > Si une combinaison comme "y a" est comptée, chacun des deux mots > "y" et "a" est en outre compté une fois de plus séparément). > > Suivent les 212 lignes jusqu'à « il y a » : > [...] Intéressant. Mais en quoi est-ce utile pour l'apprentissage du français ? -- Ubuntu Le Magicien