OSINT-словарь — это список и объяснение основных терминов с которыми можно столкнуться изучая OSINT


Базовые понятия

  • OSINT (Open-Source Intelligence / разведка по открытым источникам) — сбор и анализ общедоступных данных (сайты, соцсети, реестры, СМИ и т. п.) из открытых и общедоступных источников.
  • Источник/Отрытый источник — место, откуда берутся публичные данные: веб-страницы, форумы, видео, социальные сети, спутниковые снимки, карты, реестры, файлообменники и т.д.
  • Исходная информация — «сырые» факты, требующие проверки или верификации для превращения в осмысленную информацию и затем (*опционально) в аналитический отчёт.
  • Артефакт — конкретный элемент данных (скриншот, EXIF-метаданные, запись в реестре, пост и т. п.).
  • Гипотеза — проверяемое предположение, которое направляет поиск и верификацию.
  • Санация данных (data hygiene) — наведение порядка в собранных данных: фиксация и фильтрация источников, метаданных, файлов, а также приведение к единому формату / виду.
  • Пробив — получение данных, используя ресурсы чёрного рынка информации (слитые базы, покупка данных или документов).

Виды OSINT

  • HUMINT — получение информации, используя «человеческие источники» т.е. получение информации от людей.
  • SIGINT — перехват сигналов/трафика.
  • GEOINT — геопространственная разведка / геолокация. В большинстве случаев подразумевает получение данных о местонахождении объекта.
  • CYBINT — киберразведка. Анализ данных полученных из компьютерных систем и сетей.
  • SOCMINT — разведка в социальных сетях — процесс сбора, анализа и интерпретации данных из социальных сетей для получения ценной информации.
  • FININT — финансовая разведка, процесс сбора и анализа данных об операциях с денежными средствами.
  • IMINT — сбор разведывательной информации путем анализа изображений.

Безопасность

  • OPSEC (операционная безопасность) — защита чувствительной информации, маскировка своих действий/следов, минимизация рисков «деанонимации».
  • Конфиденциальность/персональные данные — соблюдение законов и правовых норм (GDPR/локальные нормы), минимизация избыточных данных.
  • Условия использования/лицензии — правила платформ, авторское право, допустимые способы копирования/архивирования.

Верификация и доказательства

  • Корроборация — подтверждение факта из независимых источников.
  • Атрибуция — установление авторства/принадлежности (аккаунта, файла, объекта).
  • Атрибуция источника — корректно указывать источники и факты, не выдёргивать из контекста.
  • Хронолокация — определение времени события/кадра.
  • Геолокация — определение места по ориентирам, картам, спутниковым снимкам.
  • Триангуляция — метод определения положения объектов путем построения сети треугольников на местности.
  • Chain of custody (цепочка хранения доказательств) — фиксирование, кем/когда/как получены и изменялись материалы.  Последовательность действий, подтверждающая контроль над доказательствами с момента их получения
  • Фальсификация/дезинформация — сознательно искажённые данные; манипулирование фактами для искажения данных, с целью ввести в заблуждение.
  • OSINT-отчёт (report) — структурированный документ с перечислением фактов, гипотез и доказательств, содержащий итоговые выводы.

Инструменты (общие термины)

  • Футпринтинг — процесс сбора информации о системе.
  • Dorking (Google/Яндекс/операторы поиска) — поисковые запросы с использованием операторов уточнения поиска.
  • Scraping (скрейпинг) — процесс автоматизированного сбора и извлечения данных с веб-сайтов с помощью специальных программ или ботов.
  • Фингерпринтинг — определение технологий/версий сайта, отпечатков браузера/устройства.
  • Pivoting (пивот) — переход от одного артефакта / системы к другим (например: email → ник → соцсети → домен).
  • Link analysis (анализ связей) — граф (визуализация) объектов и их связей (например: люди-организации-аккаунты-адреса).
  • Watchlist (наблюдательный список) — заранее заданные объекты и триггеры для мониторинга.
  • Data enrichment (обогащение) — дополнение необработанных данных дополнительным контекстом.

Веб термины

  • WHOIS/ RDAP — это протоколы и связанные с ними службы предназначенные для получения регистрационной информации о доменных именах и IP-адресах. WHOIS — это более старый текстовый протокол. RDAP — более структурированный протокол на основе HTTP(S) с ответами в формате JSON, который постепенно заменяет WHOIS.
  • DNS-записи (A, AAAA, MX, NS, TXT) — это элементы системы доменных имен (DNS), которые связывают человекочитаемые доменные имена с IP-адресами серверов.
  • HTTP-заголовки — это пары «ключ-значение» в HTTP-сообщениях, передающие дополнительную информацию между клиентом (браузером) и сервером.
  • Сертификаты TLS — это цифровые документы, которые подтверждают подлинность веб-сайта и используются для установления зашифрованного, защищённого соединения между браузером и сервером.
  • robots.txt — это текстовый файл, размещаемый в корневом каталоге сайта, который содержит инструкции для поисковых роботов о том, какие страницы или разделы сайта нужно индексировать, а какие — запрещено
  • sitemap.xml — одержит список всех важных страниц сайта с информацией об их приоритетности и дате последнего обновления
  • Фавикон — небольшая иконка, которая идентифицирует веб-сайт и отображается во вкладке браузера, в списке закладок, в истории посещений и в результатах поиска

Соцсети и коммуникация

  • UID/ID — числовой идентификатор записи/аккаунта.
  • Slug — человекочитаемый хвост в URL (может содержать имя/дату).
  • Метаданные медиа (EXIF) — «данные о данных», которые содержат информацию о самом медиафайле (изображении, видео, аудио и т. д.). Это могут быть: автор, дата создания, разрешение, ключевые слова, местоположение, авторские права, настройки камеры и т.д.
  • Reverse image search (обратный поиск по картинке) — поиск источника/вариантов изображения.
  • Сигналы активности — время постинга, частота, платформы, зоны.
  • Контекст публикации — сопутствующая информация: дата/время, реакции, репосты, комментарии к записи.

Геолокация

  • Кадастр — система учёта сведений о земельных участках и объектах на них.
  • Кадастровый номер — уникальный идентификатор который присваивается земельному участку / объекту внесённому в кадастр.
  • Векторные слои/тайлы — это способ представления географических данных в виде набора векторных объектов (точек, линий, полигонов) и их атрибутов.
  • EXIF-координаты — это географические координаты (широта и долгота), сохраняемые в метаданных файла изображения.
  • AIS — это автоматическая идентификационная система, которая позволяет судам и береговым службам обмениваться информацией о местоположении, курсе, скорости и другими навигационными данными.
  • ADS-B — это авиационная технология, которая позволяет самолетам передавать по радиоканалу свою точную позицию, высоту, скорость, курс и другую информацию.
  • Toponymy (топонимика) — изучение географических названий (топонимов): их происхождение, смысловое значение, развитие, современное состояние, написание и произношение.

Аналитика

  • K-факторы/индикаторы — ключевые показатели эффективности, как правило это числовые метрики, отражающие степень достижения целей или результативность.
  • Confidence (уверенность) — оценка степени уверенности в выводах/источниках.
  • Limitations (ограничения) — то, что могло повлиять на выводы.
  • Narrative (нарратив) — структурированный набор данных (фактов) используемый для формирования определённого мнения или эмоционального воздействия.
  • Визуализация — процесс преобразования информации, идей или данных в наглядные образы, такие как графики, диаграммы, схемы или изображения.
  • Архивирование — организация материалов для их долгосрочного хранения.

Практики работы с данными

  • Версионирование — хранение версий (файлов/заметок/графов) с датами.
  • Нормализация форматов — единые форматы времени, имён, координат.
  • Таксономия/тэги — единые метки для быстрых фильтров и поиска.
  • Рабочий журнал (logbook) — система организации рабочих записей.
  • Reproducibility (воспроизводимость) — способ фиксации доказательств, позволяющий получить те же данные при повторении того же процесса.

Организация работы в OSINT

  • Декомпозиция задачи — разбиение общей цели на более мелкие подзадачи, отвечающие на конкретные вопросы (например: что / кто / как / когда / где / почему).
  • Scope (рамки исследования) — чёткие границы действий: методы и способы которые могут быть задействованы, что исключено, какие источники допустимы.
  • Гипотеза и критерии опровержения — предположение + признаки (факторы), при которых оно будет его неверным (чтобы избегать «подтверждающего уклона»).
  • BLUF (Bottom Line Up Front) — метод подачи информации, при котором главное сразу помещается в начало, чтобы можно было быстро понять суть.
  • Приоритизация:
    • MoSCoW — метод приоритезации задач по степени важности: Must Have (обязательно), Should Have (нужно), Could Have (желательно) и Won’t Have (можно перенести)
    • ICE — метод оценки задач по трем параметрам: Impact (влияние), Confidence (уверенность), Ease (простота).
  • Триаж — метод сортировки входящих данных и распределение планируемых целей: «в работу», «на потом», «в архив/отклонить».
  • Матрица сбора — таблица «вопрос → источник → метод → метрики успеха → срок».
  • Таймбоксинг — метод тайм-менеджмента, при котором выделяются фиксированные слоты времени на конкретную задачу (поиск/проверку).
  • SOP (Standard Operating Procedure) — документ с пошаговыми инструкциями, описывающий, как последовательно и правильно выполнять конкретную задачу.
  • Версионирование данных — процесс присвоения уникальных номеров (v1/v2/…) или меток различным состояниям одного объекта. Применяется когда не допустимо переписывание истории.
  • CRAAP — методика оценки достоверности информации по пяти критериям: Currency (актуальность), Relevance (релевантность), Authority (авторитетность), Accuracy (точность) и Purpose (цель). Помогает критически оценивать источники и определять их пригодность для исследований.
  • Матрица RACI — метод распределения ответственности по ролям: исполнитель (Responsible), подотчетный (Accountable), консультант (Consulted), информированный (Informed). В OSINT может применятся для предотвращения утечек: каждой роли передаётся только необходимая информация.
  • Кросс-проверка (Peer Review) — другой сотрудник проверяет логику, источники и выводы.
  • Оценка вероятности (Likelihood) — прогноз наступления определенного события, с оценкой шансов в процентах или по явной шкале: «низкая/средняя/высокая».
  • Мониторинг и алерты — что и как отслеживаем после основного анализа (изменения страниц, новые посты, новые записи и т.п.).
  • Алерты — события требующие внимания. Как правило подразумевают необходимость проведения дополнительного анализа т.к. могут влиять на общую картину.