Форум программистов, компьютерный форум, киберфорум
C#: Базы данных
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.52/21: Рейтинг темы: голосов - 21, средняя оценка - 4.52
0 / 0 / 0
Регистрация: 24.09.2015
Сообщений: 8

Необходим словарь русских слов для лингвистического анализа

29.09.2015, 19:40. Показов 4271. Ответов 1
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Привет. Решила заняться обработкой текстов на основе лингвистического анализа. И сразу встал вопрос - где взять словарь русского языка? Не вбивать же все слова вручную в БД. Слышала, что есть специальные словари для разных языков и для с# в том числе, и что с ними как-то можно устанавливать связь. В интернете ничего такого найти не смогла. Может кто-нибудь знает о таких словарях подробнее?
0
cpp_developer
Эксперт
20123 / 5690 / 1417
Регистрация: 09.04.2010
Сообщений: 22,546
Блог
29.09.2015, 19:40
Ответы с готовыми решениями:

Нужен большой словарь русских слов без знаков
(для использования в своем приложении на C#) Помогите, пожалуйста нагуглить словарь с разными частями речи Желательно до 7 утра, а то...

Программа для анализа русских/английских текстов
Уфф, в общем я студент-самоучка, пытаюсь охватить побольше теории, но с практикой дело у меня идёт не очень активно. Тк мой код никто...

Выбор технологии для разработки лингвистического сайта
Есть задача накопления различной текстовой информации (произведения писателей, словари, ...), обработка этой информации (составление...

1
2511 / 1132 / 582
Регистрация: 07.06.2014
Сообщений: 3,286
29.09.2015, 22:21
беглый поиск в гугле по словам "Словарь русских слов скачать"

легко приводит, например, к таким результатам
Словарь Про-Линг
125723 слова

Содержит, в отличие от словаря Зализняка, большое количество аббревиатур, составных слов, собственных имен, причастий. Используются строчные и прописные буквы. Буква "ё" заменена буквой "е".
1. Обратный (инверсионный) cловарь (крб., куб., руб., ... девичья, ничья, преисподняя) Выравнивание: 35 знаков pldb-win.zip 469 Кб
2. Словарь с обычным (лексикографическим) порядком следования (а.л., а-конто, абажур, абажурный, ... ящичник, ящичный) pldf-win.zip 399 Кб
Исходный материал для словаря любезно предоставлен miram.
Огромное спасибо Mikola Ramanouski (2:450/21.12) за идею и поддержку.
Последняя редакция 14-06-2001 15:20

Словарь русской литературы
162232 слова

Содержит слова, взятые из 447 произведений прозаиков и поэтов XIX-XX веков. Рядом с каждым словом указывается количество образцов этого слова (всего проанализировано 2.39 млн. слов)
Внешний вид словарей
1. Обратный (инверсионный) cловарь Выравнивание: 40 знаков litb-win.zip 796 Кб
2. Словарь с обычным порядком следования litf-win.zip 589 Кб
3. Частотный словарь (по убыванию частоты) litc-win.zip 588 Кб
4. Длино-частотный словарь (сначала слова длиной 1 букву, потом 2 и т.д.) litw-win.zip 686 Кб
Подробнее о проекте.
Исходный материал для словаря взят из Библиотеки Максима Мошкова.
Ссылка по теме: http://www.artint.ru/projects/frqlist.asp
Орфографический словарь п/р проф. Лопатина (2000 год)
ок. 162000 статей, текст

Перевод в текст (С) Александр Ильин, 2002
Последняя редакция (163294 статьи) 31.01.03
Полный вариант для загрузки в БД (2,0 Мб) Образец текста
Краткий вариант без ударений (562 Кб) Образец текста
Новый толково-словообразовательный словарь русского языка. Автор Т. Ф. Ефремова. 2000 г.
136 тыс. словарных статей (подробнее)

Формат Windows, txt+rar, 2.4 MB
Образец текста
Условные сокращения и знаки
Перевод в текст (С) Игнат Александров, 2004

Толковый словарь под ред. C. И. Ожегова, 1991 г.
61458 статей

ozhegovw.zip 1934 Кб, текст Windows c разделителями Образец текста

Толковый словарь под ред. C. И. Ожегова и Н.Ю.Шведовой, М., Азъ, 1992 г.
40518 статей

Текст Windows форматированный, в формате RAR (3 куска по 890 Кб) 1 2 3 Образец текста

Толковый словарь В.И.Даля (II изд. (1862-1866), адаптировано, OCR 1998 год)
ок. 44000 статей, текст DOS

TXT + RAR (5.18 MB)
Условные обозначения и сокращения в словаре Даля
Пословицы и поговорки русского народа (680 Кб)
Заветные пословицы и поговорки (10 kb)

Cловарь синонимов Н. Абрамова
19108 статей, текст Windows
Разумеется, это далеко не полный список.

p.s. ссылки легко найти самостоятельно.
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
raxper
Эксперт
30234 / 6612 / 1498
Регистрация: 28.12.2010
Сообщений: 21,154
Блог
29.09.2015, 22:21
Помогаю со студенческими работами здесь

Программка для анализа ключевых слов дала сбой
Маленькая программка klooch Проблема заключается в том, что при её использовании (чтобы проверить "конкурентность" ключевого...

Создать словарь для перевода 5-6 иностранных слов
Помогите, пожалуйста! Очень нужно. Надо решить две задачи на тему "Pascal - ветвление". А я не очень-то разбираюсь. 1) Ввести...

Алфавитно-частотный словарь для заданного файла со списком слов
Постройте полную программу, которая составляет алфавитно-частотный словарь для заданного файла со списком слов. В предыдущей задаче...

Библиотека для склонения русских слов в разные падежи
Кто чем пользуется? Интересуют бесплатные библиотеки для склонений русских слов в разные падежи.

Аматорский Англо-Русский словарь для начинающего. Более 3300 слов
Было когда-то изучал английский язык. И что бы по-проще - составил для себя перечень слов которые интересны (а поэтому хорошо запоминаются)...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
2
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru