С Новым годом! Форум программистов, компьютерный форум, киберфорум
C# для начинающих
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 4.67/21: Рейтинг темы: голосов - 21, средняя оценка - 4.67
0 / 0 / 0
Регистрация: 01.04.2018
Сообщений: 57

Сравнение на схожесть двух текстов

01.04.2018, 19:29. Показов 4582. Ответов 2
Метки нет (Все метки)

Студворк — интернет-сервис помощи студентам
Здравствуйте! Задача такова что нужно сравнить два текста на схожесть и вывести результат в %. Также дополнительно можно чтоб показывались самые часто встречаемые слова. Я видел здесь пример кода:
C#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
public static void analizeFiles(String filePath1, String filePath2)
        {
            //Считать файлы
            String firstFileText = File.ReadAllText(filePath1);
            String secondFileText = File.ReadAllText(filePath2);
 
            //Разбить по пробелу
            String[] firstDirtyWords = firstFileText.Split(new string[] { " " }, StringSplitOptions.RemoveEmptyEntries);
            String[] secondDirtyWords = secondFileText.Split(new string[] { " " }, StringSplitOptions.RemoveEmptyEntries);
 
            //Очистить слова от начальных или конечных знаков, перевести все в нижний регистр
            for (int i = 0; i < firstDirtyWords.Length; i++)
            {
                firstDirtyWords[i] = firstDirtyWords[i].ToLower();
                if (!Char.IsLetterOrDigit(firstDirtyWords[i][0])) 
                    firstDirtyWords[i] = firstDirtyWords[i].Substring(1, firstDirtyWords[i].Length - 2);
                if (!Char.IsLetterOrDigit(firstDirtyWords[i][firstDirtyWords[i].Length - 1]))
                    firstDirtyWords[i] = firstDirtyWords[i].Substring(0, firstDirtyWords[i].Length - 2);
            }
 
            for (int i = 0; i < secondDirtyWords.Length; i++)
            {
                secondDirtyWords[i] = secondDirtyWords[i].ToLower();
                if (!Char.IsLetterOrDigit(secondDirtyWords[i][0]))
                    secondDirtyWords[i] = secondDirtyWords[i].Substring(1, secondDirtyWords[i].Length - 2);
                if (!Char.IsLetterOrDigit(secondDirtyWords[i][secondDirtyWords[i].Length - 1]))
                    secondDirtyWords[i] = secondDirtyWords[i].Substring(0, secondDirtyWords[i].Length - 2);
            }
 
            //Тут как-то анализировать полученные слова в переменных firstDirtyWords и secondDirtyWords
            //...
        }
Но как дальше работать с полученными данными не знаю. Как мне вывести в консоли % их схожести?
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
01.04.2018, 19:29
Ответы с готовыми решениями:

Сравнение двух текстов С#
Здравствуйте, помогите пожалуйста, как сделать в C# вместо посимвольного сравнение строк, сравнить 2 текста в файле, на количество схожих...

Сравнение кадров видео на схожесть
имея быстрый способ сравнения изображения типа https://www.cyberforum.ru/blogs/529033/blog3507.html (Обертка над Bitmap для быстрого...

Схожесть двух массивов
Доброе время суток!(извините за то что неграмотно пишу) Подскажите пожалуйста, хотя бы идею, дальше сделаю сам. Есть два целочеслительных...

2
0 / 0 / 0
Регистрация: 21.01.2018
Сообщений: 22
02.04.2018, 10:14
Вам нужно проверить на схожесть слов или букв?
Можно проверять по буквам. Затем соотношение всех букв и совпавших букв вывести в проценты.
Чтобы проверить слова можно находить пробел и разделить текст на слова. Эти слова проверить, и так же соотношение всех слов и совпавших выводишь в проценты
0
911 / 796 / 329
Регистрация: 08.02.2014
Сообщений: 2,391
02.04.2018, 10:15
На хабре было уйма статей по сравнению текста, либо ищи реализации там, либо пиши свою как душе угодно (как пример если сравнение построчно то берёшь 2 слова и начинаешь посимвольно сравнивать их как только символы разошлись всё записываешь процентаж, как пример).

Либо есть второй вариант есть библиотека DiffPlex (вроде так называется) в NuGet качаешь её, и "травишь" ей информацию, она тебе выдаст сравнительный анализ, который уже используй как тебе удобно
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
02.04.2018, 10:15
Помогаю со студенческими работами здесь

Оценить схожесть двух картинок
Салют! У меня есть 2 изображения следующего вида: Как можно сравнить два изображения и сказать - это ожно и тоже или нет. ...

Сравнение на схожесть двух текстов
Ни у кого нет исходника в делфи программы для сравнения двух текстов, и вывода процента схожести текста.... Сравнение нужно не по символам,...

Сравнение двух текстов на схожесть по методу Шингла
Ругается в коде, не могу понять что не так сделано. Должно сравнивать 2 текста на схожесть по методу Шингла. # -*- coding: UTF-8 -*- ...

Сравнение двух полей на схожесть значений
Задача может показаться глупой. Есть таблица(к примеру): Списки КОД | Значение 1 | Хлеб,Молоко,Печенье 2 |...

сравнение двух текстов
Подскажите, пожалуйста, программу (или сайт), с помощью которой можно сравнить два (или более) текста на предмет схожести/различия.


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
3
Ответ Создать тему
Новые блоги и статьи
Новый CodeBlocs. Версия 25.03
palva 04.01.2026
Оказывается, недавно вышла новая версия CodeBlocks за номером 25. 03. Когда-то давно я возился с только что вышедшей тогда версией 20. 03. С тех пор я давно снёс всё с компьютера и забыл. Теперь. . .
Модель микоризы: классовый агентный подход
anaschu 02.01.2026
Раньше это было два гриба и бактерия. Теперь три гриба, растение. И на уровне агентов добавится между грибами или бактериями взаимодействий. До того я пробовал подход через многомерные массивы,. . .
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост.
Programma_Boinc 28.12.2025
Советы по крайней бережливости. Внимание, это ОЧЕНЬ длинный пост. Налог на собак: https:/ / **********/ gallery/ V06K53e Финансовый отчет в Excel: https:/ / **********/ gallery/ bKBkQFf Пост отсюда. . .
Кто-нибудь знает, где можно бесплатно получить настольный компьютер или ноутбук? США.
Programma_Boinc 26.12.2025
Нашел на реддите интересную статью под названием Anyone know where to get a free Desktop or Laptop? Ниже её машинный перевод. После долгих разбирательств я наконец-то вернула себе. . .
Thinkpad X220 Tablet — это лучший бюджетный ноутбук для учёбы, точка.
Programma_Boinc 23.12.2025
Рецензия / Мнение/ Перевод Нашел на реддите интересную статью под названием The Thinkpad X220 Tablet is the best budget school laptop period . Ниже её машинный перевод. Thinkpad X220 Tablet —. . .
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Как объединить две одинаковые БД Access с разными данными
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2026, CyberForum.ru