Содержание
Распознавание изображений — область практически бесконечного применения. Его используют и небольшие стоковые сервисы, и крупные соцсети, чтобы сортировать крупные объемы графических данных и фильтровать пользовательский контент. В этом материале мы расскажем, как своими руками сделать бот в Telegram, который сможет распознавать изображения, используя нейронные сети.
Зачем это нужно?
Автоматизация помогает ползователям найти изображение по теме и экономит их время: у стока Unsplash есть функция поиска, которая находит картинки по ключевому слову.
Системы распознавания нужны владельцам системы, чтобы, например, фильтровать контент, на котором присутствуют обнаженные тела. Такими фильтрами пользуется Instagram. Варианты приложения подобных технологий бесконечны.
Но какое решение выбрать для задачи распознавания? Есть очень много готовых решений и столько же проприетарного (которое находится в собственности правоообладателя) и open-source программного обеспечения, на базе которых можно создать свое собственное решение.
Есть много провайдеров, которые предоставляют услуги по распознаванию изображений и видео с помощью API: Google Vision, Amazon Rekognition, Clarifai. Но если для вас важен вопрос прав на владение данными и конфиденциальности, то лучше будет создать собственный инструмент для распознавания изображений на базе существующих технологий. Стоит отдельно упомянуть ряд open-source решений: TensorFlow, Darknet, MLpack и Keras, которые позволят лучше контролировать то, что происходит с вашими изображениями.
Сначала мы сосредоточимся на создании нашего собственного классификатора изображений, используя Darknet. Затем мы напишем на Python бот для Telegram и разместим его на платформу для разработчиков Glitch для взаимодействия с классификатором.
Внешне процесс будет выглядеть следующим образом: пользователь выбирает изображение и отправляет его боту в Telegram. Бот классифицирует и распознает объекты на изображении, а потом отправляет пользователю результат.
Курс
Data Science с нуля
Освойте программирование на Python, научитесь использовать нейросети и получите все навыки реального дата-сайентиста на практике. Скидка по промокоду BLOG 5%.
Узнать больше
Шаги
1. Строим скелет бота
Используйте пошаговую инструкцию из этого поста. Выполните первые два шага и измените имя приложения по своему вкусу. Не зацикливайтесь на дескрипторах бота, позже мы добавим нужный нам дескриптор для обработки полученных изображений.
2. Подключаем Darknet
Для того, чтобы проанализировать изображения, отправленные боту, нам нужно подключить Darknet. Все команды установки доступны в файле install.sh в проекте на Glitch.
Для ввода команд выберите в нашем проекте на Glitch Tools > Full Page Console.
Выберите Full Page Console, чтобы установить Darknet
Чтобы установить Darknet, перейдите в папку .data в Glitch. Это важно, потому что эта папка будет сохранена, когда Glitch перейдет в спящий режим.
cd .data
git clone https://github.com/pjreddie/darknet.git
cd darknet
make
Важно: Несмотря на то что вы можете обучать свои собственные модели (и должны, в зависимости от того, как вы планируете их использовать), обычно это довольно дорогой вычислительный процесс. Учитывая, что мы будем запускать нашего бота с помощью Glitch с очень ограниченными мощностью и местом (1 CPU, 512 RAM, 200 MB памяти), обучить модель будет совершенно невозможно.
В нашем случае лучшим решением будет использовать предварительно обученную модель. Мы будем задействовать существующие веса, это позволит нам справиться быстрее. Мы загрузим два файла весов: darknet19.weights для классификации изображений и yolov3-tiny.weights для распознавания объектов.
# execute in the ./darkent directory
wget https://pjreddie.com/media/files/darknet19.weights
wget https://pjreddie.com/media/files/yolov3-tiny.weights
Важно: мы выбрали небольшие веса из-за ограничений памяти и мощности процессора, которые доступны в Glitch на данный момент. Вы можете использовать и другие веса (подробнее об этом можно узнать в разделах сайта Darknet о классификации изображений и обнаружении объектов), если вы работаете в среде с большими мощностями. Тогда полученный результат будет еще лучше.
3. Подключаем бот
Отлично, скелет нашего бота готов, Darknet установлен, время подключить наш бот. Я не буду пояснять здесь каждую строчку кода ниже, весь код с подробными комментариями вы можете найти в моем проекте на Glitch.
Ниже приведен фрагмент кода основного дескриптора (обратите внимание, что он использует вспомогательные функции). Он срабатывает каждый раз, когда новая картинка отправляется в бот.
Профессия
Fullstack-разработчик
Освой программирование и fullstack-разработку на Python и Django
Перейти к курсу
Выводы
Использование готовых API для распознавания изображений дает невероятные возможности, но когда конфиденциальность или возможность офлайн обработки имеют решающее значение, создание собственной системы распознавания может быть отличной альтернативой.
Обратите внимание, что наш пример показал только небольшую долю функционала и продуктивности, которых возможно достичь с помощью других тренировочных наборов и подходов.
Ресурсы
- Проект бота на Glitch → https://glitch.com/~telegram-image-classfication-bot
- Документация по Darknet → https://pjreddie.com/darknet/
Курсы по теме
Профессия
Data Scientist
Помощь в трудоустройстве
Курс
Python для анализа данных
Помощь в трудоустройстве
Курс
Python для веб-разработки
Помощь в трудоустройстве
Статья не несёт в себе рекламы! Опубликована с целью ознакомления с полезными инструментами!
Теневые боты помогут найти практически любую информацию о человеке на основе минимальных данных. Необычные боты для индетификации человека, пробив по базам и другие полезные инструменты месседжера. Все боты на момент написания статьи исправно работают. Никакого мусора, только сок! • EGRUL @egrul_bot Пробивает конторы/ИП, по вводу ФИО/фирмы предоставляет ИНН объекта; учредителей бизнеса/партнеров и отчет налоговую декларацию. И наоборот: поиск по ИНН выдаст ФИО/конторы. Базы данных сами понимаете откуда рџ¤ђ Ограничений бота – нет. рџ‡·рџ‡є Россия • BMI NP @bmi_np_bot По номеру телефона определяет регион и оператора. Интересно, что этот бот определяет даже новые номера и определяет номера, которые были перенесены совершенно недавно. Проверял. Удивило рџ?Џ рџЊЏ Любая страна • WHOIS DOMAIN @whoisdombot пробивает всю основную информацию о нужном домене (адрес сайта), IP и другое. рџЊЏ Любая страна • MAILSEARCH @mailsearchbot По запросу пробива e-mail выдает открытый пароль от ящика если тот есть в базе. Очень серьезная база данных. Висит давно, 1.5 млрд учёток, год актуальности ~<2014г.. Удобно составлять/вычислять персональные чарсеты с помощью, например, JTR. Функционал условно бесплатный. рџЊЏ Любая страна • <b>GETFB @getfb_bot По запрашиваемому номеру телефона выдает ссылку на личность в FaceBook. Функционал бесплатный. рџЊЏ Любая страна • BUZZIM ALERPTS @buzzim_alerts_bot Поисковая система по платформе Telegram. Ищет упоминания ников/каналов в чатах статьях. Присутствует функция оповещения, если что-то где-то всплывёт. Например, можно посмотреть какие каналы разнесли твои посты с Хабра, проверить ник юзера, где он еще трепался. Функционал бесплатный. рџЊЏ Любая страна • AVINFO @avinfobot который по вводу мобильного телефона выдаст номер машины/марку, а также ссылку и все объявления на Avito.ru. В демо-режиме бесплатно доступно несколько таких поисков/отчетов. Ценник за функционал приличный, некоторые хитрожопые юзеры только ради этого бота сбрасывают свой аккаунт в Telegram, чтобы бесплатно пробивать своих жертв (бесконечное удаление/регистрация учетки на один и тот же номер телефона). БД Avito – или проданная или сдёрнутая, в любом случае хочется дать им в Авито по ИБ.
• HOWTOFIND @howtofind_bot Робот разведчик. Подскажет секреты и приемы OSINT. рџЊЏ Любая страна • SMART SEARCH @smart_searchbot Отличный бот, очень полный. Помогает найти дополнительную информацию, относительно телефонного номера, id ВКонтакте, email, или ИНН юр./физ. лица. рџЊЏ Любая страна • WHOIS DOMAIN @whoisdombot пробивает всю основную информацию о нужном домене (адрес сайта), IP и другое. рџЊЏ Любая страна 👀 Лучшие боты OSINT для Telegram Топ▫️ @LeakedInfoBot – Лучший бот для поиска любой слитой информации о человеке!▫️ @usersbox_bot – поиск по ФИО, нику, номеру телефона, email или профилю в соцсетях. Поиск по Sherlock.▫️ @telesint_bot – позволяет узнать, в каких публичных чатах состоит пользователь. Сейчас в базе данных бота находится более 179 тысяч публичных чатов и записи о более чем 45.5 миллионах пользователей. ▫️ @tgscanrobot – так же как и предыдущий бот проверяет наличие пользователя в публичных чатах. На данный момент в базе бота содержится более 709 тысяч чатов, 116 миллионов уникальных пользователей. ▫️ @maigret_osint_bot – проверка username. Maigret проверяет наличие зарегистрированного пользователя с конкретным никнеймом среди 1366 различных сайтов. За основу был взят инструмент Sherlock, который создатель бота начал развивать. ▫️ @ChatSearchRobot – поиск схожих по тематике чатов. В базе бота содержится более 709 тысяч чатов. ВК ▫️ @InfoVkUser_bot – анализ друзей профиля ВК. Сейчас доступны ВУЗы и родные города. ▫️ @VKUserInfo_bot – выдает полную инфу о профиле ВК. Другие соцсети ▫️ @InstaBot – скачивает любые медиафайлы из Instagram. ▫️ @SaveYoutubeBot – ищет и скачивает ролики из YouTube. ▫️ @getfb_bot – поиск страницы в Facebook по номеру телефона. ▫️ @clerkinfobot – поиск по номеру телефона и username Telegram. ▫️ @numberPhoneBot – кто звонил? ▫️ @get_kontakt_bot – поиск номера по GetContact. Telegram ▫️ @username_to_id_bot – позволяет получить ID пользователя, чата, канала или бота. ▫️ @creationdatebot – показывает дату создания аккаунта. ▫️ @SangMataInfo_bot – может показать историю смены никнеймов пользователя. ▫️ @MotherSearchBot – аналог Google, но для Telegram. Поможет найти нужный канал, текст, аудио или документ. ▫️ @buzzim_alerts_bot – анализ семантики. Поиск по открытым сообщениям в Telegram. Email ▫️ @GetYandexBot – поиск аккаунтов, привязанных к почте Yandex. ▫️ @GetGmail_bot – поиск аккаунтов, привязанных к почте Gmail. Домены ▫️ @WhoisDomBot – отображает whois-инфу для домена или IP-адреса. ▫️ @iptools_robot – умеет искать уязвимости на сайтах, собирать информацию про IP и домены, искать субдомены и многое другое.
#Обучение
Недавние разоблачительные публикации известного оппозиционера Алексея Навального всколыхнули волну небывалого интереса общественности к теневому бизнесу, связанному с услугами пробива. То, что почти любые данные у нас продаются и покупаются, — не секрет, но, говорят, кое‑что можно разузнать и вовсе бесплатно у ботов в «Телеграме». Сегодня я расскажу про лучшие Telegram-боты для пробива и поиска информации.
Большинство ботов Telegram, выполняющих по запросу пользователя поиск и выдачу персональных данных, работают по схеме OSINT, то есть опираются на открытые источники, для чего эксплуатируют API различных служб и интернет‑ресурсов. Другие используют слитые базы данных, но такие сервисы, во‑первых, не всегда функционируют стабильно, а во‑вторых, испытывают проблемы с актуализацией информации: любая утекшая в паблик база со временем устаревает и, разумеется, не обновляется.
Незаконный сбор персональной информации — это нарушение закона «О персональных данных» и других законов РФ. Также подобные действия могут образовать состав преступления по статье 137 УК РФ «Нарушение неприкосновенности частной жизни». Ни автор, ни редакция не несут ответственности за любые последствия использования приведенных в этой публикации сведений, которые представлены здесь исключительно ради информирования читателя.
Монетизируются подобные боты либо за счет донатов, либо за счет рекламы, или же админы ограничивают количество бесплатных запросов, после чего бот начинает просить денег за каждую следующую выдачу. Иногда — если админы ну очень жадные — используются все методы сразу.
Люди ищут персональную информацию по разным причинам. Кто‑то пытается таким образом отыскать своих отравителей должников или симпатичную соседку по подъезду с большими и красивыми си… ними глазами. Кто‑то разыскивает прямые контакты блогеров или владельцев пабликов либо пытается из чистого любопытства посмотреть посты в закрытых профилях соцсетей своей бывшей.
Еще можно по номеру машины отыскать мобильный телефон подрезавшего вас на дороге водятла, позвонить ему, назвать по имени‑отчеству и вежливо попросить объяснений. Некоторые «гонщики» в такие моменты почему‑то немного смущаются. В общем, причины могут быть разными, а средство одно: условно‑бесплатные Telegram-боты или услуги пробива, до сих пор широко рекламируемые в даркнете.
Telegram-боты для пробива и поиска информации
Очевидно, что не все боты одинаково полезны. Некоторые просят денег, но в ответ либо не находят актуальную информацию, либо отдают откровенную туфту. Другие вроде бы работают, но настолько странно, что достоверность предлагаемых ботом данных остается сомнительной. Чтобы вы не тратили драгоценное время и деньги на поиск жемчужин в куче органических удобрений, ваш любимый сайт spy-soft.net протестировал наиболее популярные боты Telegram для пробива и прямо сейчас поделится с вами полученными результатами. Погнали!
Get Contact
Бот ищет по слитым базам пароли, соответствующие адресам электронной почты, логинам или номеру телефона. Бесплатно бот показывает только часть обнаруженных паролей, а за полной версией отправляет на сторонний сайт, где посетителю с ходу предлагают оплатить подписку.
Заключение
Мои эксперименты показали, что боты для поиска персональных данных в целом могут быть полезны, но с небольшими оговорками:
- большинство из них — платные, и качество поиска информации там все равно среднее, выдачу придется верифицировать и перебирать вручную;
- есть пара бесплатных вариантов с ограничением на количество запросов, но в выдаче присутствует высокий процент шлака.
Даже несмотря на то, что большинство ботов использует одни и те же источники информации, для уточнения данных лучше применять сразу несколько инструментов — это повысит релевантность поиска и качество результатов. Тем не менее для серьезного расследования без услуг профессиональных пробивал все равно не обойтись: они имеют доступ к актуальным служебным базам различных государственных и коммерческих организаций, вернее, связь с сотрудниками, которые, в свою очередь, могут обращаться к этим базам.
Боты могут подсказать направление поиска и расширить набор исходных данных, но в качестве полноценного инструмента для пробива персональных данных они вряд ли сгодятся.
Источник
Chipollino Onion Club
@chipollin0nion 112 417
— Кибербезопасность уязвимости&…
[netstalkers]
@netstalkers 77 133
Всё что не помещается в Ютуб-формат К…
Life-Hack [Жизнь-Взлом]/Хакинг
@haccking 51 599
Крупнейшее сообщество по информационн…
DEEPWEB
@Odeepweb 46 797
Все о темной стороне интернета Серые …
Темная Сторона Интернета
@deeptoweb 40 655
Первый канал о кибербезопасности и те…
Темная гавань
@the_dark_harbor 36 440
Ежедневная свежая информация из темно…
CyberYozh
@cyberyozh_official 26 521
Создаем лучший бесплатный курс по ано…
Библиотека хакера
@hackerlib 25 243
Литература по программированию информ…
[YT] UnderMind
@under_public 21 813
Не взлом а проверка на защищённость
SEBLOG ENCYCLOPEDIA | Социальная инженерия
@aboutse 18 882
Канал создан для освещения темы социа…
Типичный Мошенник
@scamersant 17 492
Хакер — Xakep.RU
@xakep_ru 15 701
XakepRU: взлом защита кодинг
Cybersecurity & Co.
@alexlitreev_channel 15 556
Aleksandr Litreev about cybersecurity…
Журнал Хакер
@hacker_lib 10 067
Архив журнала Xakep неофициальный
АКБ
@CyberAgency 6 896
Агентство Кибербезопасности
Лохотрона NET
@lohotrona_net 6 688
Рассказываем о схемах и уловках мошен…
✪ ХАКЕРСТВО ✪
@XAKEPCTBO_channel 5 075
Секреты операционных систем малоизвес…
deep stuff
@deepstuff 3 098
Слив качественных инфопродуктов закры…
Шифропанк
@cypherpunkru 2 429
Авторские статьи мануалы гайды с поша…
The Dark Side
@darkside_channel 1 782
Авторские статьи схемы заработка прив…
▪️ DARKNET ▪️
@darkest_net 1 727
Блокчейн и криптовалюта▪️ Авторские с…
Телеграмм каналы о Хакерах и Даркнете, тем кто не знает, что это такое “Загуглите”. 🙂 Тем же кто в теме можете ознакомиться с данным разделом.
Copyright © 2022 telepot.ru, Все права защищены.
ли со статьей или есть что добавить?