С Новым годом! Форум программистов, компьютерный форум, киберфорум
Python: API, боты
Войти
Регистрация
Восстановить пароль
Карта форума Темы раздела Блоги Сообщество Поиск Заказать работу  
 
Рейтинг 5.00/4: Рейтинг темы: голосов - 4, средняя оценка - 5.00
0 / 0 / 0
Регистрация: 13.02.2023
Сообщений: 59
1
Telegram Bot

Бот-модератор пропускает символы в комментариях

16.10.2023, 20:19. Показов 740. Ответов 14

Author24 — интернет-сервис помощи студентам
Бот-модератор удаляет комментарии при совпадении слов в словаре. Однако, пропускает спам-комментарии с указанными ниже символами в словах. Их добавление в словарь не помогает.
Подскажите, что это за символы в словах и как с ними бороться?

"ρᴀсπροсτpaняйтe", "эτи", "ужacныᧉ", "κᴀдpы", "вᴏ," "евpᴏпейcᴋuх", "чτoбы", "видeлu", "ᴋοмy", "πᴏмᴏгᴀюꚍ", "тбиτыe", "πᴏймали", "πᴏльсᴋyю", "нᴀᧉмнuцy", "жᧉсꚍκᴏ", "нᧉй", "пᴩедвᴀρuтельнο", "вывeзя", "лᧉс", "Οнᴀ", "κτo", "таᴋиᧉ", "уκpᴏпы", "сᴀмᴏм", "дeлᧉ", "связывaꚍься", "быcτρᴏ", "ρазлᧉτeлuсь", "тᧉлeгρаму", "пoсмοтρeτь", "бᧉз", "цᧉнзγpы", "тγꚍ", "ᴏ", "τ", "Сᴩᴏчнᴏ", "pᴀсπρoсτpaнuтe", "эτи", "ужᴀсные", "ᴋaдpы", "ᧉx", "евρoпᧉйcких", "Oꚍбиꚍыe", "пᴏймᴀли", "πᴏльсκую", "наeмницγ", "жеcꚍκο", "надpγгᴀлuсь", "пpᧉдвapительнο", "вывᧉзя", "лᧉс", "uзбuв", "зналᴀ", "ктo", "ꚍaκиᧉ", "укρoπы", "cамoм", "дeле", "нuмu", "связываꚍься", "Kадpы", "бысτᴩᴏ", "pᴀзлᧉτᧉлись", "πᴏ", "вcᧉмy", "ꚍᧉлегρамy", "Пοcмᴏτpᧉꚍь", "цензyᴩы", "Эτa", "сᴋaꚍuнᴀ", "пοймᴀна", "нашuмu", "бᴏйцами", "пᴩи", "шꚍγᴩме", "γκρᧉπᴀ"
0
Programming
Эксперт
39485 / 9562 / 3019
Регистрация: 12.04.2006
Сообщений: 41,671
Блог
16.10.2023, 20:19
Ответы с готовыми решениями:

Странные символы в комментариях,битая кодировка с++
Добрый вечер! у меня в коде комментарии превратились в какой то нечитабельный мусор, кто нибудь...

пропускает символы при сканировании числового штрихкода
Доброго дня, Есть проблема при работе сканера с базой данных Аксес 2007. При сканировании в...

Регулярное выражение, которое пропускает все символы, кроме пробелов
Я состряпал такое вот выражение preg_match("#^+$#",$password) но оно по какой-то причине не...

Функция пропускает первый символ исходной строки in и записывает остальные символы в строку out
Помогите пожалуйста исправить ошибки в программе, и пожалуйста с объяснением моих ошибок, всё...

Глючено вводит/выводит символы. Пропускает сканф. Только при 4 сканфах считывает. С выводом такая же дичь
Ещё в этой строке ничего не выводит if (string==symb) { jey++; } Т.е как было 0,так и...

14
3567 / 2714 / 348
Регистрация: 11.03.2009
Сообщений: 6,249
16.10.2023, 22:09 2
Цитата Сообщение от Stepper Посмотреть сообщение
Подскажите, что это за символы
Буквы других алфавитов, я как миниму узнал греческие омикрон, тау, гамма, но не исключено, что есть буквы и из других алфавитов.
Цитата Сообщение от Stepper Посмотреть сообщение
и как с ними бороться?
Подозреваю могут помочь специальные либы для обработки текста, у меня в этой области мало опыта, про либы не расскажу.
Варианты для начинающих:
1) для длинных слов можно применить нечеткий поиск вместо прямого сравнения, гуглите "расстояние левенштейна"
2) составить словарь для русского алфавита, где для каждой буквы сопоставить список с похожими буквами из других алфавитов, далее первым шагом преобразуем исходный текст к одному алфавиту, вторым шагом ищем совпадения слов. В качестве второго шага можно использовать первый вариант с нечетким поиском.
1
Нарушитель
98 / 76 / 30
Регистрация: 10.05.2023
Сообщений: 312
17.10.2023, 00:40 3
Цитата Сообщение от Stepper Посмотреть сообщение
как с ними бороться?
"ρᴀсπροсτpaняйтe", "эτи", "ужacныᧉ", "κᴀдpы", "вᴏ," "евpᴏпейcᴋuх", "чτoбы", "видeлu", "ᴋοмy", "πᴏмᴏгᴀюꚍ", "тбиτыe", "πᴏймали", "πᴏльсᴋyю", "нᴀᧉмнuцy", "жᧉсꚍκᴏ", "нᧉй", "пᴩедвᴀρuтельнο", "вывeзя", "лᧉс", "Οнᴀ", "κτo", "таᴋиᧉ", "уκpᴏпы", "сᴀмᴏм", "дeлᧉ", "связывaꚍься", "быcτρᴏ", "ρазлᧉτeлuсь", "тᧉлeгρаму", "пoсмοтρeτь", "бᧉз", "цᧉнзγpы", "тγꚍ", "ᴏ", "τ", "Сᴩᴏчнᴏ", "pᴀсπρoсτpaнuтe", "эτи", "ужᴀсные", "ᴋaдpы", "ᧉx", "евρoпᧉйcких", "Oꚍбиꚍыe", "пᴏймᴀли", "πᴏльсκую", "наeмницγ", "жеcꚍκο", "надpγгᴀлuсь", "пpᧉдвapительнο", "вывᧉзя", "лᧉс", "uзбuв", "зналᴀ", "ктo", "ꚍaκиᧉ", "укρoπы", "cамoм", "дeле", "нuмu", "связываꚍься", "Kадpы", "бысτᴩᴏ", "pᴀзлᧉτᧉлись", "πᴏ", "вcᧉмy", "ꚍᧉлегρамy", "Пοcмᴏτpᧉꚍь", "цензyᴩы", "Эτa", "сᴋaꚍuнᴀ", "пοймᴀна", "нашuмu", "бᴏйцами", "пᴩи", "шꚍγᴩме", "γκρᧉπᴀ"
Ты добавляешь их именно скопировав, а фильтр их все равно пропускает? Фильтр вообще работает на обычных ругательствах?
0
0 / 0 / 0
Регистрация: 13.02.2023
Сообщений: 59
17.10.2023, 08:21  [ТС] 4
Цитата Сообщение от ARTURK16 Посмотреть сообщение
Фильтр вообще работает на обычных ругательствах?
Да, отлично работает. А вот эти комментарии пропускает.
0
Нарушитель
98 / 76 / 30
Регистрация: 10.05.2023
Сообщений: 312
17.10.2023, 11:03 5
Цитата Сообщение от Stepper Посмотреть сообщение
Да, отлично работает. А вот эти комментарии пропускает.
вся соль этого на первый взгляд в том что бот не умеет работать или со словами из разных букв или вовсе кроме анг и русских знаков не фильтрует...
0
Автоматизируй это!
Эксперт Python
7209 / 4703 / 1224
Регистрация: 30.03.2015
Сообщений: 13,408
Записей в блоге: 29
17.10.2023, 11:32 6
Stepper, нормальный чел не вставляет в свои слова символы других алфавитов, уж точно не греческие, латиница еще ладно. Потому - для латиницы словарь сравнения букв, для остальных букв -сразу мут и удаление сообщения

Добавлено через 14 секунд
говорю как админ телеграм чата
2
Нарушитель
98 / 76 / 30
Регистрация: 10.05.2023
Сообщений: 312
17.10.2023, 12:17 7
Вы можете использовать модуль re в Python (если бот на Python) для проверки, содержит ли строка только символы из английского и русского алфавитов. Например, вы можете использовать следующее регулярное выражение: ^[a-zA-Zа-яА-Я]+$. Если строка не соответствует этому шаблону, то она содержит символы, не относящиеся к указанным алфавитам.
1
Администратор
Эксперт .NET
17712 / 13839 / 5313
Регистрация: 17.03.2014
Сообщений: 28,346
Записей в блоге: 1
17.10.2023, 14:10 8
Цитата Сообщение от ARTURK16 Посмотреть сообщение
апример, вы можете использовать следующее регулярное выражение: ^[a-zA-Zа-яА-Я]+$
Кажется тут буква ё пострадает. По моему надо так - а-яёА-ЯЁ.
0
Нарушитель
98 / 76 / 30
Регистрация: 10.05.2023
Сообщений: 312
17.10.2023, 16:24 9
Цитата Сообщение от OwenGlendower Посмотреть сообщение
Кажется тут буква ё пострадает. По моему надо так - а-яёА-ЯЁ.
Гулять так гулять, добавим еще и цифры)) вот примерно с этого можно начать например:
Python
1
2
3
4
5
6
7
8
import re
 
def check_alphabet(string):
    pattern = r'^[a-zA-Zа-яА-ЯёЁ0-9]+$'
    if re.match(pattern, string):
        return True
    else:
        return False
1
Эксперт .NET
12557 / 8726 / 1311
Регистрация: 21.01.2016
Сообщений: 32,738
19.10.2023, 08:27 10
ARTURK16, ещё пунктуацию не забыть, скобки-кавычки, математические операторы, разные $%, смайлики-эмоджи...
0
Нарушитель
98 / 76 / 30
Регистрация: 10.05.2023
Сообщений: 312
19.10.2023, 11:21 11
Цитата Сообщение от Usaga Посмотреть сообщение
ещё пунктуацию не забыть, скобки-кавычки, математические операторы, разные $%, смайлики-эмоджи...
может мы брутальные ребята и не признаем всякие кавычки и смайлики
0
0 / 0 / 0
Регистрация: 13.02.2023
Сообщений: 59
19.10.2023, 20:50  [ТС] 12
Вообще странно: за последнюю неделю бот стал пропускать комментарии даже с теми стоп-словами, которые есть в словаре: личку, видосики и т.д. Такие комментарии появляются через секунду после публикации.
Миниатюры
Бот-модератор пропускает символы в комментариях  
0
Нарушитель
98 / 76 / 30
Регистрация: 10.05.2023
Сообщений: 312
19.10.2023, 22:35 13
Цитата Сообщение от Stepper Посмотреть сообщение
через секунду после публикации
через публикацию чего?
а так вот слово "личкy" написал чере игрик, в видосиках можно "ос" на английском написать... Нужно твоему боту гибридные слова запретить когда в одном слове разные языки есть
1
0 / 0 / 0
Регистрация: 13.02.2023
Сообщений: 59
19.10.2023, 22:45  [ТС] 14
Цитата Сообщение от ARTURK16 Посмотреть сообщение
через публикацию чего?
публикация в телеграм-канале. это бот, не получается его забанить

Цитата Сообщение от ARTURK16 Посмотреть сообщение
написал чере игрик
в словаре есть несколько вариантов написания.
запретить гибриды - это через модуль re?
0
Нарушитель
98 / 76 / 30
Регистрация: 10.05.2023
Сообщений: 312
19.10.2023, 22:59 15
Цитата Сообщение от Stepper Посмотреть сообщение
это через модуль re?
как вариант
0
19.10.2023, 22:59
inter-admin
Эксперт
29715 / 6470 / 2152
Регистрация: 06.03.2009
Сообщений: 28,500
Блог
19.10.2023, 22:59
Помогаю со студенческими работами здесь

Не понимаю почему не пропускает компилятор. Если у вас пропускает пришлите пожалуйста что получилось
Написать и протестировать метод, находящий сумму элементов заданного целочисленного ступенчатого...

Пропускает ввод данных в консоли. Не работает часть кода. Пропускает ввод фио
Добрый день! Помогите пожалуйста! В void add_dinamo() пропускает cout<<"ФИО: \t" ;...

Бот Анфиса и бот Алиса хотят сыграть во что-нибудь по сети
Бот Анфиса и бот Алиса хотят сыграть во что-нибудь по сети. Каждая из них составила список игр, в...

Новый модератор
Буду строгим, но справедливым. :) <b>Новичкам форума</b> Всегда готов помочь вам в разрешении...

Модератор в UCOZ
люди научите пожалуйста как зделать челавека модератором в системе по созданию сайтов укоз


Искать еще темы с ответами

Или воспользуйтесь поиском по форуму:
15
Ответ Создать тему
Блоги программистов
Как перейти с Options API на Composition API в Vue.js
BasicMan 06.01.2025
Почему переход на Composition API актуален В мире современной веб-разработки фреймворк Vue. js продолжает эволюционировать, предлагая разработчикам все более совершенные инструменты для создания. . .
Архитектура современных процессоров
inter-admin 06.01.2025
Процессор (центральный процессор, ЦП) является основным вычислительным устройством компьютера, которое выполняет обработку данных и управляет работой всех остальных компонентов системы. Архитектура. . .
История создания реляционной модели баз данных, правила Кодда
Programming 06.01.2025
Предпосылки создания реляционной модели В конце 1960-х годов компьютерная индустрия столкнулась с серьезными проблемами в области управления данными. Существовавшие на тот момент модели данных -. . .
Полезные поделки на Arduino, которые можно сделать самому
raxper 06.01.2025
Arduino как платформа для творчества Arduino представляет собой удивительную платформу для технического творчества, которая открывает безграничные возможности для создания уникальных проектов. Эта. . .
Подборка решений задач на Python
IT_Exp 06.01.2025
Целью данной подборки является предоставление возможности ознакомиться с различными задачами и их решениями на Python, что может быть полезно как для начинающих, так и для опытных программистов. . . .
С чего начать программировать микроконтроллер­­ы
raxper 06.01.2025
Введение в мир микроконтроллеров Микроконтроллеры стали неотъемлемой частью современного мира, окружая нас повсюду: от простых бытовых приборов до сложных промышленных систем. Эти маленькие. . .
Из чего собрать игровой компьютер
inter-admin 06.01.2025
Сборка игрового компьютера требует особого внимания к выбору комплектующих и их совместимости. Правильно собранный игровой ПК не только обеспечивает комфортный геймплей в современных играх, но и. . .
Обновление сайта www.historian.b­y
Reglage 05.01.2025
Обещал подвести итоги 2024 года для сайта. Однако начну с того, что изменилось за неделю. Добавил краткий урок по последовательности действий при анализе вредоносных файлов и значительно улучшил урок. . .
Как использовать GraphQL в C# с HotChocolate
Programming 05.01.2025
GraphQL — это современный подход к разработке API, который позволяет клиентам запрашивать только те данные, которые им необходимы. Это делает взаимодействие с API более гибким и эффективным по. . .
Модель полного двоичного сумматора с помощью логических операций (python)
AlexSky-coder 04.01.2025
def binSum(x:list, y:list): s=^y] p=x and y for i in range(1,len(x)): s. append((x^y)^p) p=(x and y)or(p and (x or y)) return s x=list() y=list()
Это мы не проходили, это нам не задавали...(аси­­­­­­­­­­­­­­хро­н­н­ы­й счётчик с управляющим сигналом задержки).
Hrethgir 04.01.2025
Асинхронный счётчик на сумматорах (шестиразрядный по числу диодов на плате, но наверное разрядов будет больше - восемь или шестнадцать, а диоды на старшие), так как триггеры прошли тестирование и. . .
Руководство по созданию бота для Телеграм на Python
IT_Exp 04.01.2025
Боты для Телеграм представляют собой автоматизированные программы, которые выполняют различные задачи, взаимодействуя с пользователями через интерфейс мессенджера. В данной статье мы рассмотрим,. . .
КиберФорум - форум программистов, компьютерный форум, программирование
Powered by vBulletin
Copyright ©2000 - 2025, CyberForum.ru