Sis-Terr открыла мне страшную тайну
Итак, жил-был сайт. Часть его страниц была закрытой админской зоной. Причем закрыта была не в robots.txt (а зачем?), а на уровне доступа "white list" - то есть зайти туда можно было только с офисных IP самой компании.
И как же было удивительно видеть часть этих страниц в выдаче Гугла, причем, (вот это уже За Гранью Добра) не только страниц, но и сниппетов и сохраненной копии.
В общем расследование показало:
- Робот Гугла, естественно, туда зайти не мог - получал 500-ю ошибку.
- Но - была куча заходов с реферером от офисного Google Chrome, причем даже от тех людей, вход которых не был предусмотрен служебными обязанностями.
- Анализ трафика показывает, что Хром не просто отправляет URL посещенных пользователем страниц, но и их содержимое (!). Вот откуда и сниппеты, и сохраненная копия.
Как результат:
- Ну в общем я понимаю, что персональные данные всем безразличны, но тут уже речь идет о корпоративной информации в публичном доступе. Неужели и ей готовы делиться с Империей Добра?
- Google Chrome в нашей организации объявлен Spyware и запрещен.
Первая мысль естественно была пойти в суд, но увы - я не в России, и у нас нет такого вкусного закона о персональной информации. Но мы размышляем над этим.
Кстати, и robots.txt Гугль не соблюдает - прямо закрытые им страницы все равно будут в выдаче как найденные (по ссылке? Нет таких ссылок!), но уже без сниппета и сохраненной копии (и на том спасибо!) Примеры опять же есть.
источник:
Внимание! У Вас нет прав для просмотра скрытого текста.
Внимание! Данная статья была написана более полугода назад, актуальность материала и состояние жизни ссылок не гарантируется! Воспользуйтесь дополнительными параметрами для поиска необходимого вам контента! Приносим свои извинения...