Форум программистов, компьютерный форум, киберфорум
Python: API, боты
Войти
Регистрация
Восстановить пароль
Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/4: Рейтинг темы: голосов - 4, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 13.02.2023
Сообщений: 59
Telegram Bot

Бот-модератор пропускает символы в комментариях

16.10.2023, 20:19. Показов 981. Ответов 14

Студворк — интернет-сервис помощи студентам
Бот-модератор удаляет комментарии при совпадении слов в словаре. Однако, пропускает спам-комментарии с указанными ниже символами в словах. Их добавление в словарь не помогает.
Подскажите, что это за символы в словах и как с ними бороться?

"ρᴀсπροсτpaняйтe", "эτи", "ужacныᧉ", "κᴀдpы", "вᴏ," "евpᴏпейcᴋuх", "чτoбы", "видeлu", "ᴋοмy", "πᴏмᴏгᴀюꚍ", "тбиτыe", "πᴏймали", "πᴏльсᴋyю", "нᴀᧉмнuцy", "жᧉсꚍκᴏ", "нᧉй", "пᴩедвᴀρuтельнο", "вывeзя", "лᧉс", "Οнᴀ", "κτo", "таᴋиᧉ", "уκpᴏпы", "сᴀмᴏм", "дeлᧉ", "связывaꚍься", "быcτρᴏ", "ρазлᧉτeлuсь", "тᧉлeгρаму", "пoсмοтρeτь", "бᧉз", "цᧉнзγpы", "тγꚍ", "ᴏ", "τ", "Сᴩᴏчнᴏ", "pᴀсπρoсτpaнuтe", "эτи", "ужᴀсные", "ᴋaдpы", "ᧉx", "евρoпᧉйcких", "Oꚍбиꚍыe", "пᴏймᴀли", "πᴏльсκую", "наeмницγ", "жеcꚍκο", "надpγгᴀлuсь", "пpᧉдвapительнο", "вывᧉзя", "лᧉс", "uзбuв", "зналᴀ", "ктo", "ꚍaκиᧉ", "укρoπы", "cамoм", "дeле", "нuмu", "связываꚍься", "Kадpы", "бысτᴩᴏ", "pᴀзлᧉτᧉлись", "πᴏ", "вcᧉмy", "ꚍᧉлегρамy", "Пοcмᴏτpᧉꚍь", "цензyᴩы", "Эτa", "сᴋaꚍuнᴀ", "пοймᴀна", "нашuмu", "бᴏйцами", "пᴩи", "шꚍγᴩме", "γκρᧉπᴀ"
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
16.10.2023, 20:19
Ответы с готовыми решениями:

Странные символы в комментариях,битая кодировка с++
Добрый вечер! у меня в коде комментарии превратились в какой то нечитабельный мусор, кто нибудь знает ,как "расшифровать" от...

пропускает символы при сканировании числового штрихкода
Доброго дня, Есть проблема при работе сканера с базой данных Аксес 2007. При сканировании в поле таблицы или формы пропускает...

Регулярное выражение, которое пропускает все символы, кроме пробелов
Я состряпал такое вот выражение preg_match("#^+$#",$password) но оно по какой-то причине не пропускает русские буквы в $password. А если...

14
 Аватар для kazak
3599 / 2741 / 354
Регистрация: 11.03.2009
Сообщений: 6,298
16.10.2023, 22:09
Цитата Сообщение от Stepper Посмотреть сообщение
Подскажите, что это за символы
Буквы других алфавитов, я как миниму узнал греческие омикрон, тау, гамма, но не исключено, что есть буквы и из других алфавитов.
Цитата Сообщение от Stepper Посмотреть сообщение
и как с ними бороться?
Подозреваю могут помочь специальные либы для обработки текста, у меня в этой области мало опыта, про либы не расскажу.
Варианты для начинающих:
1) для длинных слов можно применить нечеткий поиск вместо прямого сравнения, гуглите "расстояние левенштейна"
2) составить словарь для русского алфавита, где для каждой буквы сопоставить список с похожими буквами из других алфавитов, далее первым шагом преобразуем исходный текст к одному алфавиту, вторым шагом ищем совпадения слов. В качестве второго шага можно использовать первый вариант с нечетким поиском.
1
Нарушитель
110 / 86 / 32
Регистрация: 10.05.2023
Сообщений: 323
17.10.2023, 00:40
Цитата Сообщение от Stepper Посмотреть сообщение
как с ними бороться?
"ρᴀсπροсτpaняйтe", "эτи", "ужacныᧉ", "κᴀдpы", "вᴏ," "евpᴏпейcᴋuх", "чτoбы", "видeлu", "ᴋοмy", "πᴏмᴏгᴀюꚍ", "тбиτыe", "πᴏймали", "πᴏльсᴋyю", "нᴀᧉмнuцy", "жᧉсꚍκᴏ", "нᧉй", "пᴩедвᴀρuтельнο", "вывeзя", "лᧉс", "Οнᴀ", "κτo", "таᴋиᧉ", "уκpᴏпы", "сᴀмᴏм", "дeлᧉ", "связывaꚍься", "быcτρᴏ", "ρазлᧉτeлuсь", "тᧉлeгρаму", "пoсмοтρeτь", "бᧉз", "цᧉнзγpы", "тγꚍ", "ᴏ", "τ", "Сᴩᴏчнᴏ", "pᴀсπρoсτpaнuтe", "эτи", "ужᴀсные", "ᴋaдpы", "ᧉx", "евρoпᧉйcких", "Oꚍбиꚍыe", "пᴏймᴀли", "πᴏльсκую", "наeмницγ", "жеcꚍκο", "надpγгᴀлuсь", "пpᧉдвapительнο", "вывᧉзя", "лᧉс", "uзбuв", "зналᴀ", "ктo", "ꚍaκиᧉ", "укρoπы", "cамoм", "дeле", "нuмu", "связываꚍься", "Kадpы", "бысτᴩᴏ", "pᴀзлᧉτᧉлись", "πᴏ", "вcᧉмy", "ꚍᧉлегρамy", "Пοcмᴏτpᧉꚍь", "цензyᴩы", "Эτa", "сᴋaꚍuнᴀ", "пοймᴀна", "нашuмu", "бᴏйцами", "пᴩи", "шꚍγᴩме", "γκρᧉπᴀ"
Ты добавляешь их именно скопировав, а фильтр их все равно пропускает? Фильтр вообще работает на обычных ругательствах?
0
0 / 0 / 0
Регистрация: 13.02.2023
Сообщений: 59
17.10.2023, 08:21  [ТС]
Цитата Сообщение от ARTURK16 Посмотреть сообщение
Фильтр вообще работает на обычных ругательствах?
Да, отлично работает. А вот эти комментарии пропускает.
0
Нарушитель
110 / 86 / 32
Регистрация: 10.05.2023
Сообщений: 323
17.10.2023, 11:03
Цитата Сообщение от Stepper Посмотреть сообщение
Да, отлично работает. А вот эти комментарии пропускает.
вся соль этого на первый взгляд в том что бот не умеет работать или со словами из разных букв или вовсе кроме анг и русских знаков не фильтрует...
0
Автоматизируй это!
Эксперт Python
 Аватар для Welemir1
7390 / 4817 / 1246
Регистрация: 30.03.2015
Сообщений: 13,664
Записей в блоге: 29
17.10.2023, 11:32
Stepper, нормальный чел не вставляет в свои слова символы других алфавитов, уж точно не греческие, латиница еще ладно. Потому - для латиницы словарь сравнения букв, для остальных букв -сразу мут и удаление сообщения

Добавлено через 14 секунд
говорю как админ телеграм чата
2
Нарушитель
110 / 86 / 32
Регистрация: 10.05.2023
Сообщений: 323
17.10.2023, 12:17
Вы можете использовать модуль re в Python (если бот на Python) для проверки, содержит ли строка только символы из английского и русского алфавитов. Например, вы можете использовать следующее регулярное выражение: ^[a-zA-Zа-яА-Я]+$. Если строка не соответствует этому шаблону, то она содержит символы, не относящиеся к указанным алфавитам.
1
Администратор
Эксперт .NET
 Аватар для OwenGlendower
18242 / 14156 / 5366
Регистрация: 17.03.2014
Сообщений: 28,844
Записей в блоге: 1
17.10.2023, 14:10
Цитата Сообщение от ARTURK16 Посмотреть сообщение
апример, вы можете использовать следующее регулярное выражение: ^[a-zA-Zа-яА-Я]+$
Кажется тут буква ё пострадает. По моему надо так - а-яёА-ЯЁ.
0
Нарушитель
110 / 86 / 32
Регистрация: 10.05.2023
Сообщений: 323
17.10.2023, 16:24
Цитата Сообщение от OwenGlendower Посмотреть сообщение
Кажется тут буква ё пострадает. По моему надо так - а-яёА-ЯЁ.
Гулять так гулять, добавим еще и цифры)) вот примерно с этого можно начать например:
Python
1
2
3
4
5
6
7
8
import re
 
def check_alphabet(string):
    pattern = r'^[a-zA-Zа-яА-ЯёЁ0-9]+$'
    if re.match(pattern, string):
        return True
    else:
        return False
1
Эксперт .NET
 Аватар для Usaga
14088 / 9305 / 1348
Регистрация: 21.01.2016
Сообщений: 34,929
19.10.2023, 08:27
ARTURK16, ещё пунктуацию не забыть, скобки-кавычки, математические операторы, разные $%, смайлики-эмоджи...
0
Нарушитель
110 / 86 / 32
Регистрация: 10.05.2023
Сообщений: 323
19.10.2023, 11:21
Цитата Сообщение от Usaga Посмотреть сообщение
ещё пунктуацию не забыть, скобки-кавычки, математические операторы, разные $%, смайлики-эмоджи...
может мы брутальные ребята и не признаем всякие кавычки и смайлики
0
0 / 0 / 0
Регистрация: 13.02.2023
Сообщений: 59
19.10.2023, 20:50  [ТС]
Вообще странно: за последнюю неделю бот стал пропускать комментарии даже с теми стоп-словами, которые есть в словаре: личку, видосики и т.д. Такие комментарии появляются через секунду после публикации.
Миниатюры
Бот-модератор пропускает символы в комментариях  
0
Нарушитель
110 / 86 / 32
Регистрация: 10.05.2023
Сообщений: 323
19.10.2023, 22:35
Цитата Сообщение от Stepper Посмотреть сообщение
через секунду после публикации
через публикацию чего?
а так вот слово "личкy" написал чере игрик, в видосиках можно "ос" на английском написать... Нужно твоему боту гибридные слова запретить когда в одном слове разные языки есть
1
0 / 0 / 0
Регистрация: 13.02.2023
Сообщений: 59
19.10.2023, 22:45  [ТС]
Цитата Сообщение от ARTURK16 Посмотреть сообщение
через публикацию чего?
публикация в телеграм-канале. это бот, не получается его забанить

Цитата Сообщение от ARTURK16 Посмотреть сообщение
написал чере игрик
в словаре есть несколько вариантов написания.
запретить гибриды - это через модуль re?
0
Нарушитель
110 / 86 / 32
Регистрация: 10.05.2023
Сообщений: 323
19.10.2023, 22:59
Цитата Сообщение от Stepper Посмотреть сообщение
это через модуль re?
как вариант
0
Надоела реклама? Зарегистрируйтесь и она исчезнет полностью.
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
19.10.2023, 22:59
Помогаю со студенческими работами здесь

Функция пропускает первый символ исходной строки in и записывает остальные символы в строку out
Помогите пожалуйста исправить ошибки в программе, и пожалуйста с объяснением моих ошибок, всё перечитала, туплю по-жёсткому...:( Есть...

Глючено вводит/выводит символы. Пропускает сканф. Только при 4 сканфах считывает. С выводом такая же дичь
Ещё в этой строке ничего не выводит if (string==symb) { jey++; } Т.е как было 0,так и осталось,хотя не так должно быть.

Не понимаю почему не пропускает компилятор. Если у вас пропускает пришлите пожалуйста что получилось
Написать и протестировать метод, находящий сумму элементов заданного целочисленного ступенчатого массива, расположенных на первой и...

Пропускает ввод данных в консоли. Не работает часть кода. Пропускает ввод фио
Добрый день! Помогите пожалуйста! В void add_dinamo() пропускает cout<<"ФИО: \t" ; cin.getline(b.fio, 49); а дальше...

Бот Анфиса и бот Алиса хотят сыграть во что-нибудь по сети
Бот Анфиса и бот Алиса хотят сыграть во что-нибудь по сети. Каждая из них составила список игр, в которые она умеет играть. Списки, конечно...


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
15
Ответ Создать тему
Новые блоги и статьи
PhpStorm 2025.3: WSL Terminal всегда стартует в ~
and_y87 14.12.2025
PhpStorm 2025. 3: WSL Terminal всегда стартует в ~ (home), игнорируя директорию проекта Симптом: После обновления до PhpStorm 2025. 3 встроенный терминал WSL открывается в домашней директории. . .
Access
VikBal 11.12.2025
Помогите пожалуйста !! Как объединить 2 одинаковые БД Access с разными данными.
Новый ноутбук
volvo 07.12.2025
Всем привет. По скидке в "черную пятницу" взял себе новый ноутбук Lenovo ThinkBook 16 G7 на Амазоне: Ryzen 5 7533HS 64 Gb DDR5 1Tb NVMe 16" Full HD Display Win11 Pro
Музыка, написанная Искусственным Интеллектом
volvo 04.12.2025
Всем привет. Некоторое время назад меня заинтересовало, что уже умеет ИИ в плане написания музыки для песен, и, собственно, исполнения этих самых песен. Стихов у нас много, уже вышли 4 книги, еще 3. . .
От async/await к виртуальным потокам в Python
IndentationError 23.11.2025
Армин Ронахер поставил под сомнение async/ await. Создатель Flask заявляет: цветные функции - провал, виртуальные потоки - решение. Не threading-динозавры, а новое поколение лёгких потоков. Откат?. . .
Поиск "дружественных имён" СОМ портов
Argus19 22.11.2025
Поиск "дружественных имён" СОМ портов На странице: https:/ / norseev. ru/ 2018/ 01/ 04/ comportlist_windows/ нашёл схожую тему. Там приведён код на С++, который показывает только имена СОМ портов, типа,. . .
Сколько Государство потратило денег на меня, обеспечивая инсулином.
Programma_Boinc 20.11.2025
Сколько Государство потратило денег на меня, обеспечивая инсулином. Вот решила сделать интересный приблизительный подсчет, сколько государство потратило на меня денег на покупку инсулинов. . . .
Ломающие изменения в C#.NStar Alpha
Etyuhibosecyu 20.11.2025
Уже можно не только тестировать, но и пользоваться C#. NStar - писать оконные приложения, содержащие надписи, кнопки, текстовые поля и даже изображения, например, моя игра "Три в ряд" написана на этом. . .
Мысли в слух
kumehtar 18.11.2025
Кстати, совсем недавно имел разговор на тему медитаций с людьми. И обнаружил, что они вообще не понимают что такое медитация и зачем она нужна. Самые базовые вещи. Для них это - когда просто люди. . .
Создание Single Page Application на фреймах
krapotkin 16.11.2025
Статья исключительно для начинающих. Подходы оригинальностью не блещут. В век Веб все очень привыкли к дизайну Single-Page-Application . Быстренько разберем подход "на фреймах". Мы делаем одну. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru