ingwall: (knigi)
[personal profile] ingwall
Ищу программу, которая могла бы взять текстовый файл где-то в сто тысяч слов, и выдать мне частоту их употребления в тексте, типа tag cloud. Желательно бы ещё и русскоязычную, чтобы просекала формы одного и того же слова. Никто не знает?

Date: 2010-10-15 02:48 pm (UTC)
From: [identity profile] ingwall.livejournal.com
Да, я понял уже, что он спеллчекер. Сомневаюсь, что он мне поможет.

Date: 2010-10-15 02:52 pm (UTC)
From: [identity profile] nasse.livejournal.com
Я брала слово, трансформировала в базовую форму (ispell'ом). Новое слово пихала в базу, уже имеющемуся в базе увеличивала счетчик.
Я так Черную Книгу Арды обсчитывала :)

Date: 2010-10-15 02:55 pm (UTC)
From: [identity profile] nasse.livejournal.com
Только там будут проблемы с омонимами. И словоформами-омонимами (какая).
Так что оно все равно полуручное...

April 2026

S M T W T F S
   1234
567891011
12131415161718
19 202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated May. 2nd, 2026 09:06 pm
Powered by Dreamwidth Studios