Онлайн-расследование. Приемы поиска в Google от лучших журналистов-расследователей
Для большинства пользователей интернет начинается с поисковика. В России их два: «Яндекс» и Google. И «Яндекс» на местном рынке лидирует: на него сейчас приходится порядка 63,6% поисковых запросов. Но Google — безусловный глобальный лидер с общей долей почти в 91%. И именно он — главная точка входа для поиска информации практически по всему миру. Но, чтобы поиск не превращался в кошмар с бесконечным потоком мусорных результатов, искать надо с умом. Как это делать, рассказывает спецкор The Bell Ирина Панкратова.
Как работает поиск
Чтобы эффективно искать информацию в Google, нужно понимать общий принцип его работы. Поисковик — это не искусственный интеллект, и он не пытается угадать мысли пользователя. Поисковик работает как типичная машина: выполняет команды. Поэтому и запрос к нему лучше формулировать в виде набора слов, максимально конкретных задач. Например, вместо вопроса «На каких сайтах искать квартиры в аренду в Москве?» эффективнее будет написать в поисковой строке «Аренда квартиры Москва долгосрочно».
Конкретизировать запрос и найти именно то, что вам нужно, помогают разные команды — их еще принято называть «операторами». Среди них есть довольно хорошо известные, например:
- Промежуток времени можно задать во вкладке инструменты. А можно — запросом «before:2010» или «after:2015».
- Фразы в кавычках, например «клубничное варенье», дают результаты именно с этим продуктом, а без них — и те страницы, на которых в разных местах встречаются слова «клубничное» и «варенье».
- Если добавить к слову «–», то из результатов будут исключены страницы с таким словом.
- Если формулировать запрос как «В России живет * млрд человек», то звездочка заменяет количество, но она может заменять и слова.
- Поиск документов эффективен, если использовать запрос типа «filetype: pdf мобилизация». Так вы получите только PDF-файлы со словом «мобилизация».
Подробнее об этих и других командах мы рассказывали здесь. Но ими возможности Google не ограничиваются.
В лекции «Google для ботаников» Маркус Линдеманн, немецкий osint-тренер и основатель студии документального кино, рассказывает и о других лайфхаках.
Хитрые «операторы»
- [inurl:nickname -site:twitter.com] Позволяет взять никнейм пользователя из какой-либо соцсети, в данном случае из X, которая еще недавно называлась Twitter, и исключить эту соцсеть из результатов выдачи. Таким образом можно найти другие аккаунты с этим никнеймом. А еще можно просто поискать все аккаунты с таким никнеймом через запрос [inurl:nickname].
- [inurl: forum] Так можно найти результаты запроса сугубо по форумам. В частности, такой запрос будет полезен в браузере Tor в даркнете, где значительная часть информации размещается именно на форумах.
- [intitle:Uutiset] «Uutiset» — это «новости» по-фински. С помощью такого оператора можно найти информацию на новостных сайтах конкретной страны. А еще можно использовать запросы вроде [intitle:sport] для сужения поиска внутри определенной тематики.
- [word AROUND(15) word] Здесь два заданных в запросе слова будут разделены между собой не более чем 15 (в данном случае) словами. То есть, условно говоря, будут стоять в одном абзаце либо в одном предложении, если вы зададите меньшее значение.
- [word 1000..9999] Это поиск слова по диапазону чисел. Так можно, например, искать товары по определенной цене [TV €50..€100], [Hotel California $50..$100], номера телефонов и адреса по почтовому коду [Helsinki 00100..00200], людей или события по дате [Willie Mays 1950..1960].
- [related:similarweb.com] Так можно найти сайты, похожие на нужный вам. Например, если вы хотите найти такой же, но бесплатный сервис, схожий информационный ресурс или агрегаторы.
- [filetype:pdf] Это уже знакомый нам оператор. Но список типов файлов, которые можно искать c его помощью, гораздо шире.Например, doc и docx, dotx, txt, rtf (текстовые документы), xls и xlsx, xltx, xltm (таблички), jpg, gif, png, bmp, svg, webp, ico, raw, ps (картинки), ppt и pptx, potx, potm, dwf (презентации), kml, kmz (геолокация). Причем искать лучше сразу все файлы одного вида [filetypes: doc OR filetypes: docx OR filetypes: dotx OR filetypes: txt OR filetype:rtf].
- [presentation | präsentation | powerpoint | "power point" | ppt | pptx | "thank you * attention"] Искать определенный тип файла помогает перечисление названия этого типа на разных языках — как в этом примере с презентацией. Также здесь использованы фразы, которые чаще всего включаются в презентации, такие как «спасибо за внимание». Кстати, знак «|» в запросах выполняет ту же функцию, что и «OR» — они равносильны и пользоваться можно тем, что вам удобнее.
- [site:facebook.com OR site:youtube.com OR site:whatsapp.com OR site:messenger.com OR site:instagram.com OR site:twitter.com OR site:linkedin.comOR site:snapchat.com OR site:pinterest.com OR site:reddit.com OR site:tiktok.com OR site:tumblr.com OR site:wechat.com OR site:line.me OR site:telegram.org OR site:viber.com OR site:discord.com OR site:flickr.com OR site:myspace.com] А это — готовый запрос для поиска по соцсетям, в списке может быть до 25 сайтов.
- «:n90» Это бонус: под поисковой строкой есть раздел «Инструменты», где можно задать временной промежуток для поиска, но есть и альтернативный способ — ввести запрос в поисковую строку, нажать на «поиск» и затем в конце получившейся гиперссылки добавить «:n90», где n — минуты, s — секунды, h — часы, d — дни, w — недели, m — месяцы, y — годы, а число указывает на их количество.
Google Dorking
Усложненный поиск с помощью «операторов» называют Google Dorking. Изначально под этим определением имелись в виду запросы, которые позволяли находить дыры в безопасности. Но теперь это, скорее, просто углубленный, целенаправленный поиск.
Чтобы использовать эту методику эффективно, недостаточно просто выучить все «операторы». Нужно приноровиться мыслить логически, придумывать, как их сочетать, указывает в статье «С нуля до героя гугл-доркинга» специалист по osint, аналитик израильской платформы для цифровой безопасности Perception Point Рон Камински. Он приводит примеры такого логического мышления.
— Сочетание расширений и типов файлов для выявления ценного контента, например, запрос «intext:password filetype:txt» позволяет искать текстовые файлы с открытым паролем, запрос «site:example.com intext:confidential» — страницы с пометкой «конфиденциально» на определенном сайте (подставить любой вместо example.com), запрос «filetype:pdf intitle:report» — PDF-файлы со словом «report» в заголовках, запрос «filetype:xls site:example.com» — таблицы excel в указанном домене, запрос «filetype:pdf site:example.com/confidential» — каталоги, содержащие конфиденциальные PDF-файлы в определенном домене, и так далее.
— Сочетание операторов для поиска контактов, например, запрос «intext:email OR intext:mail» показывает страницы с адресам электронных почт, а запрос «intext:username intext:password» — страницы с конфиденциальными данными учетных записей.
— Поиск по соцсетям, например, запрос «site:twitter.com intext:keyword» показывает ветки дискуссий в твиттере с определенным ключевым словом, запрос «site:linkedin.com inurl:in OR intitle:profile» — открытые профили конкретных людей.
— Сочетания для поиска утечек в открытом доступе, например, запрос «inurl:/view.shtml» помогает найти камеры наблюдения с онлайн-трансляцией, которая часто идет в открытый доступ по ошибке, а запрос «intext:username intext:password» — файлы с раскрытыми паролями и логинами.
Эти запросы — лишь примеры, на практике они имеют множество вариаций в зависимости от цели вашего поиска. Существует база запросов для Google dorking — Google Hacking Database, там тоже можно найти много идей. Наконец, есть Dork-поисковик, где можно выбрать нужные настройки галочками.
А еще Google позволяет создать собственную поисковую систему. Этот сервис предназначен для встраивания поисковой строки на сайт. Но на самом деле его можно использовать и для своих индивидуальных настроек поиска. Особенно полезен он будет, если вы часто ищете что-то по определенным параметрам, например, на одних и тех же сайтах или везде, исключая несколько конкретных ресурсов. Здесь это можно настроить, а также, допустим, можно отключить или включить поиск по изображениям. Можно также выключить «безопасный поиск», который частенько ограничивает результаты. После сохранения всех настроек Google выдаст вам «общедоступный URL» — ссылку, которую вы можете сохранить в избранное и открывать по ней вашу собственную поисковую строку в любой момент.
Что мне с этого
Умение пользоваться всеми возможностями Google может помочь серьезно сэкономить ваше время и деньги. Точная формулировка запроса позволяет получить ровно те результаты, которые вам нужны. Кроме того, с помощью приемов Google Dorking вы можете проверить уязвимости своих данных и ресурсов.