Сохранённая копия. Что такое сохраненная копия в яндексе. Кэш браузера, когда ничего не помогает

Кеш используется во многих веб-сферах для того, чтобы ускорить доступ до тех или иных данных через интернет. Например, мы уже говорили о плагине который сохраняет копии страниц сайта на хостинге для того, чтобы пользователи могли загрузить их быстрее, и уменьшить этим нагрузку на хостинг.

Также кеш есть и во всех браузерах. Он сохраняет на компьютере пользователя копии всех сайтов, которые посещались, а затем, когда к ним осуществляется очередной запрос, они подгружаются в большей части с компьютера, что также ускоряет загрузку.

И, исходя из выше сказанного, сложно предположить, что у поисковых систем нет кеша. На самом деле есть и там тоже сохраняются все ваши сайты для того, чтобы поисковик меньше напрягался, когда показывает ваш сайт. В данной статье рассмотрим, как добраться до кеш Google, узнаем, что там есть, и как это можно использовать.

Кеш Google

Кеш Google хранится на сервере поисковика и никак не затрагивает хостинг, который оплачиваете вы. Ссылка, ведущая на кеш вашего сайта отличается от настоящих ссылок вашего сайта, поэтому это никак не влияет на продвижение. В общем, ничего плохого в кеш поисковика нет.

Чтобы добраться до кеша Google, введите в поисковике необходимый запрос, и на поисковой выдаче, около искомого сайта, рядом с его ссылкой вы увидите маленький треугольник в виде стрелки вниз. Кликните на него и выберите пункт «Сохранённая копия». В новой вкладке откроется кеш этого сайта, который сохранил Google.В кеше вы увидите, от какого он числа, и вам покажут ссылку на актуальную версию страницы.

В таком виде некоторые элементы сайта могут не отображаться, например, не будет изображений или каких-то частей дизайна. Но весь текст и HTML-разметка останется.

Для нужен кеш Google

То, что кеш Google необходим для быстрой обработки сайтов поисковиком, мы уже рассказали. Теперь посмотрим, чем он может быть полезен для нас.

Представьте грустную ситуацию, что вы написали какую-то статью и на хостинге случился сбой – всё потеряно. У вас, конечно же, есть бекап сайта и можете восстановить его, но той статьи, которую вы писали, там ещё нет, ещё не успела сохраниться в бекап. Что вы тогда будете делать? Неужели станете переписывать статью заново. Гораздо легче обратиться к кешу Google и посмотреть, его робот уже успел сходить на ваш сайт, и сохранил все данные в кеше. А вообще, чтобы не пришлось это всё делать, создавайте бекап чаще. Подробнее .

Другая ситуация. Допустим, снова случилось что-то на хостинге и ваш сайт временно не доступен. Не терять же из-за этого посетителей. Так вот, многих из них устроит кеш-версия страниц, и они могут посмотреть их в поисковике.

Решение рассматривается (пока) только для одного сайта - того, на котором мы находимся. Идея появилась в результате того, что один пользователь сделал юзерскрипт, который переадресует страницу на кеш Гугла, если вместо статьи видим «Доступ к публикации закрыт». Понятно, что это решение будет работать лишь частично, но полного решения пока не существует. Можно повысить вероятность нахождения копии выбором результата из нескольких сервисов. Этим стал заниматься скрипт HabrAjax (наряду с 3 десятками других функций). Теперь (с версии 0.859), если пользователь увидел полупустую страницу, с которой можно перейти лишь на главную, в личную страницу автора (если повезёт) и назад, юзерскрипт предоставляет несколько альтернативных ссылок, в которых можно попытаться найти потерю. И тут начинается самое интересное, потому что ни один сервис не заточен на качественное архивирование одного сайта.

Кстати, статья и исследования порождены интересным опросом А вас раздражает постоянное «Доступ к публикации закрыт»? и скриптом пользователя dotneter - комментарий habrahabr.ru/post/146070/#comment_4914947 .

Требуется, конечно, более качественный сервис, поэтому, кроме описания нынешней скромной функциональности (вероятность найти в Гугл-кеше и на нескольких сайтах-копировщиках), поднимем в статье краудсорсинговые вопросы - чтобы «всем миром» задачу порешать и прийти к качественному решению, тем более, что решение видится близким для тех, кто имеет сервис копирования контента. Но давайте обо всём по порядку, рассмотрим все предложенные на данный момент решения.

Кеш Гугла

В отличие от кеша Яндекса, к нему имеется прямой доступ по ссылке, не надо просить пользователя «затем нажать кнопку „копия“». Однако, все кеширователи, как и известный archive.org, имеют ряд ненужных особенностей.

1) они просто не успевают мгновенно и многократно копировать появившиеся ссылки. Хотя надо отдать должное, что к популярным сайтам обращение у них частое, и за 2 и более часов они кешируют новые страницы. Каждый в своё время.

3) поэтому результат кеширования - как повезёт. Можно обойти все такие кеширующие ссылки, если очень надо, но и оттуда информацию стоит скопировать себе, потому что вскоре может пропасть или замениться «более актуальной» бессмысленной копией пустой страницы.

Кеш archive.org

Он работает на весь интернет с мощностями, меньшими, чем у поисковиков, поэтому обходит страницы какого-то далёкого русскоязычного сайта редко. Частоту можно увидеть здесь: wayback.archive.org/web/20120801000000*/http://habrahabr.ru
Да и цель сайта - запечатлеть фрагменты истории веба, а не все события на каждом сайте. Поэтому мы редко будем попадать на полезную информацию.

Кеш Яндекса

Нет прямой ссылки, поэтому нужно просить (самое простое) пользователя нажать на ссылку «копия» на странице поиска, на которой будет одна эта статья (если её Яндекс вообще успел увидеть).

Как показывает опыт, статья, повисевшая пару часов и закрытая автором, довольно успешно сохраняется в кешах поисковиков. Впоследствии, скорее всего, довольно быстро заменится на пустую. Всё это, конечно, не устроит пользователей веба, который по определению должен хранить попавшую в него информацию.

Из живых я нашёл пока что 4, некоторые давно существовавшие (itgator) на данный момент не работали. В общем, пока что они почти бесполезны, потому что заставляют искать статью по названию или ключевым словам, а не по адресу, по которому пользователь пришёл на закрытую страницу (а по словам отлично ищет Яндекс и не только по одному их сайту). Приведены в скрипте для какой-нибудь полезной информации.

Задача

Перед сообществом стоит задача, не утруждая организаторов сайта, довести продукт до качественного, не теряющего информацию ресурса. Для этого, как правильно заметили в комментариях к опросу, нужен архиватор актуальных полноценных статей (и комментариев к ним заодно).

В настоящее время неполное решение её, как описано выше, выглядит так:

Если искать в Яндексе, то подобранный адрес выведет единственную ссылку (или ничего):


Нажав ссылку «копия», увидим (если повезёт) сохранённую копию (страница выбрана исключительно для актуального на данный момент примера):

В Гугле несколько проще - сразу попадаем на копию, если тоже повезёт, и Гугл успел сохранить именно то, что нам надо, а не дубль отсутствующей страницы.

Забавно, что скрипт теперь предлагает «выбор альтернативных сервисов» и в этом случае («профилактические работы»):

Жду предложений по добавлению сервисов и копировщиков (или хотя бы проектов) (для неавторизованных - на почту spmbt0 на известном гуглоресурсе, далее выберем удобный формат).

UPD 23:00: опытным путём для mail.ru было выяснено строение прямой ссылки на кеш:
"http://hl.mailru.su/gcached?q=cache:"+ window.location Знатоки или инсайдеры, расскажите, что это за ссылка, насколько она стабильна (не изменится ли, например, домен 3-го уровня), что значит приставка «g»-cached? Значит ли это кеш Гугла или это кеш движка Gogo?

Возможно, сайт был подвергнут блокировке из-за нарушения закона, а может этот сайт просто пока что не отвечает на запрос. Как бы ни была причина, иногда вам нужно взять какую информацию с сайта, который совсем недавно перестал работать или был взломан и лишился всего контента. В большинстве случаев удача может повернуться к вам лицом. Вы можете просмотреть кэшированную версию этого сайта в Google?

Кэшированные сайты: что это?

Для того чтобы быстро отыскать все эти сайты, Google и другие поисковые системы сохраняют внутреннюю копии этих сайтов на серверах. Эти сохраненные файлы и называются кэшем, и Google позволяет их просматривать, если такая копия существует. Раньше этот процесс был очень понятен – вам просто нужно было нажать ссылку, представленную под результатом, выданном в поиске. Сейчас все немного сложнее, но вам не стоит беспокоиться, так как кэшированные сайты по-прежнему существуют.

Смотрим кэш сайта в Гугл :

1. Попробуйте найти что-нибудь. В данном случае, мы будем искать по ключу «кеширование», и предположим, что в коем-то веке Wikipedia ушла в даун.

2. Наведите курсор мыши на результат поиска, но не кликайте.
3. Вы увидите, что рядом справа от результата появится стрелка вправо. Кликните по этой стрелке.
4. Теперь вы можете видеть миниатюру сайта. Вы также увидите ссылку Cached сверху от миниатюры. Можете кликать по этой ссылке.

Таким образом, вы будете перенаправлены к кэшированной версии сайта. И эта версия не обязательно будет содержать актуальные данные. Это просто копия сайта в том состоянии, в котором бот Google последний раз его сканировал, и на самом деле эта страница хранится на сервере Google, и поэтому ссылка будет начинаться с webcache.googleusercontent.com, а не с Wikipedia.org. Google также расскажет вам о том, насколько свежая эта копия.

Иногда бывает так, что на страницах отсутствуют изображения или фоны. Вы можете кликнуть по ссылке в верхней части страницы и увидеть текстовую версию сайта, который вы на данный момент читаете. Иногда это помогает найти необходимую вам информацию. Вы также можете кликнуть по ссылке, которая приведет вас к актуальной странице, если вам вдруг нужно будет сравнить две эти версии.

Если вам нужно найти определенный термин, вы можете воспользоваться сочетанием клавиш Ctrl+F, и просто отыскать его при помощи вашего браузера.

Сайты, которые не кэшируются

У большинства сайтов есть кэшированные копии, но бывают и исключения. Владельцы сайтов могут использовать файл robots.txt для того, чтобы попросить поисковую систему не индексировать сайт, либо удалять кэш. Иногда такое бывает, когда владелец хочет полностью удалить сайт, и не хочет, чтобы где-то появлялся его контент. Ведь существует довольно много сайтов с «черным» контентом или контентом, который не обязательно должен индексироваться (приватные форумы, информация о кредитных картах или сайты с платным доступом к контенту).

Вы можете проследить за тем, как изменялся сайт, воспользовавшись инструментом от Google под названием WebArchive , но функционал этого инструмента также может быть запрещен файлом robots.txt.

Кэш Гугл Хром - это хранилище для временных файлов. Фото, аудио- и видеопотоки, текст, анимированные картинки помещаются в него в процессе загрузки веб-страницы, запрашиваемой пользователем. Когда нужно будет её снова открыть, Google Chrome из кэша «перенесёт» её элементы во вкладку, не затрачивая время и сетевой трафик на их повторную загрузку с сервера с сайта.

В Гугле Хроме иногда у пользователей возникает потребность узнать, где находится кэш-хранилище, как его посмотреть (найти в нём необходимые данные), отключить и как перенести в другую директорию (раздел диска, папку). О том, как выполняются эти действия, настройки, подробно читайте далее.

Где хранится кэш?

Чтобы открыть директорию, в которой находятся файлы с кеш-памятью, выполните эту инструкцию:

1. Закройте браузер.

2. Нажмите вместе клавиши «Win» и «R».

3. Скопируйте и вставьте в строчку «Открыть», на панели «Выполнить», этот путь:

%userprofile%\Local Settings\Application Data\Google\Chrome\User Data\Default\Cache

4. Кликните «OK».

5. В новом окне отобразится кэш браузера (группа файлов с данными).

Как удалить кэш?

Чтобы обновить кэш, убрать из него всю ранее загруженную информацию, вызовите панель для настройки и выполнение очистки (обновления) при помощи комбинации клавиш «Ctrl + Shift + Del». Подробней о том, как выполняется эта процедура, .

Как просмотреть содержимое хранилища?

1. В адресной строке Хрома наберите запрос - chrome://cashe. Нажмите «Enter».

2. Все данные сохранённые в кэше данные отобразятся в новой вкладке (в виде ссылок).

3. Чтобы быстро найти в списке необходимую информацию, нажмите одновременно клавиши «Ctrl + F». В мини-панели, появившейся вверху справа, введите необходимый запрос (название домена, файла) и нажмите «Enter».

4. Найденные данные подсветятся в списке.

Совет! Также быстрый доступ к кэшу можно получить при помощи аддона Click&Clean. В его меню есть кнопка «Просмотреть кэш… ».

Как перенести папку хранилища в другую директорию?

Если вам необходимо переместить файлы кэша на другой диск или в другую папку по причине нехватки места на диске или из-за соображений безопасности, конфиденциальности данных, выполните следующие действия:

1. Закройте окно Хрома.

2. Вызовите панель «Выполнить» (Win + R).

3. В строку «Открыть» введите:

%userprofile%\\local settings\\application data\\google\\chrome

4. Нажмите «Enter».

5. Откроется системное окно с папкой User Data. Скопируйте её: клик правой кнопкой → Копировать.

6. Вставьте скопированную папку в директорию, где вы желаете её разместить. Дождитесь завершения переноса данных.

7. Клацните правой кнопкой по ярлыку браузера на рабочем столе.

8. В контекстном меню щёлкните «Свойства».

9. В строчке «Объект» после пути к исполняемому файлу добавьте с отступом в один пробел команду в формате:

--user-data-dir="C:\\User Data"

Где C:\\User Data - это путь к новому месту хранения кэша (у вас может быть другое значение!).

10. Нажмите «Применить» и «OK».

Таким же методом добавления дополнительных команд в свойства ярлыка вы можете создать и другие надстройки для кэша Google Chrome. Например:

Disk-cache-size= - изменить (увеличить/уменьшить) размер кэша (если установить значение «0», он будет отключен);

Как отключить сохранение данных в кэш?

1. Нажмите сочетание клавиш «Ctrl + Shift + I».

2. В открывшемся блоке кликните кнопку «три точки».

3. В выпавшем меню клацните строчку «Settings».

4. В подразделе «Preferences» найдите блок «Network» (прокрутите список настроек скроллом немного вниз).

5. Установите флажок возле опции «Disable cashe… ».

6. Закройте все дополнительные окна (щелчком по значку «крестик»).

Если требуется временное отключение, вы можете перейти в режим анонимного веб-сёрфинга. При его включении файлы в хранилище не сохраняются.

Активируется он так:

1. Кликните по кнопке «Меню».

2. Выберите пункт «Новое окно в режиме инкогнито».

Успешной вам очистки и настройки кэша в Хроме!

Интернет - вещь абсолютно не постоянная. Любой сайт в силу различных обстоятельств (обрывы линий электропередач, банкротство хостера, неоплата домена) может перестать работать. В браузерах пользователей после этого отобразятся только сообщения о недоступности любимого ресурса. Если же сайт изменится до неузнаваемости, а страницу с важной информацией удалит администрация, ресурс продолжит свою работу, но конечному потребителю неприятностей в этом случае не избежать.

Не стоит волноваться и проклинать злой рок. Быть может, портал недоступен временно, а специалисты заняты восстановлением его работы. Помимо этого, у каждого пользователя Глобальной сети есть мощный инструмент, который позволит получить необходимую информацию, - кэш сайтов.

Google

Google - мегакорпорация, мощности серверов которой имеют возможность постоянно сканировать Интернет на предмет появления новых страниц и изменения старых. Добавляя ресурсы в свою базу, алгоритмы не только но и делают их снимки. Грубо говоря, Google создает резервные копии Интернета на тот случай, если исходный материал станет недоступным.

Кэш сайтов Google доступен всем без исключения. Чтобы получить доступ к любой проиндексированной странице, в строку поисковика требуется ввести запрос: . На экране отобразится копия страницы, в верхней части экрана будет показана следующая информация:

  • Дата последнего сохранения, что даст возможность судить, могла ли измениться представленная информация.
  • Здесь же располагается ссылка на снимок, в котором содержится только текст.
  • Еще один URL покажет полный исходный код, который заинтересует веб-мастеров.

Владельцам ресурсов в Интернете нужно знать, что кэш сайтов компании Google - добровольная в использовании система. Если необходимо исключить какие-либо страницы вашего портала из списка сохраненных, можно запретить делать снимки. Для этого на страницу нужно добавить метатег . Также запретить или разрешить кэширование можно в рабочем кабинете, если вы имеете соответствующий аккаунт.

Если же вам нужно удалить уже сохраненные снимки из кэша Google, потребуется отправить электронное письмо с запросом, а потом подтвердить свои права на сайт.

"Яндекс"

На втором месте в списке компаний, сохраняющих кэш сайтов, располагается отечественный гигант индустрии. Охват "Яндекса" намного меньше, поэтому здесь стоит искать в основном снимки крупных, обладающих высокой посещаемостью ресурсов.

Просто введите в поисковую строку URL нужной страницы и нажмите ENTER. Результаты поиска покажут необходимый вам сайт на первом месте выдачи. Рядом со ссылкой на него будет располагаться иконка в виде треугольника. Кликнув на нее и выбрав пункт меню «сохраненная копия», откроете последний доступный снимок страницы.

The Wayback Machine

В 1996 году Брюстер Кейл открыл некоммерческую организацию, которую сейчас называют архивом Интернета. Компания занимается сбором копий веб-страниц, видеоматериалов, графических изображений, аудиозаписей, программного обспечения. Собранный материал архивируется, а бесплатный доступ к нему может получить любой желающий.

Главная цель The Wayback Machine - сохранение культурных ценностей, созданных цивилизацией после широкого распространения Интернета, создание наиболее полной электронной библиотеки человечества. В настоящий момент в Архиве хранится более 10 петабайт данных, что позволяет пользователям ознакомиться с 85 миллиардами веб-страниц. Это значит, Архив - наиболее полный кэш сайтов.

Archive.org - сайт организации, на нем можно попытаться найти снимок необходимой страницы. Так как сохраняется не только последняя копия, а бот просматривает ресурсы периодически, можно изучить все изменения, сделанные на определенной странице с течением времени, даже если сайт уже не существует. В строке поиска желательно использовать префикс WWW.

Dead URL

«Мертвый адрес» предоставляет для пользователей похожие возможности. Скопируйте из нерабочий URL и вставьте его в поле ввода на сайте. Сервис немного подумает и выдаст несколько результатов. Некоторые из них будут ссылаться на ресурс компании Google. Другая часть приведет пользователя на страницы Архива. Что немаловажно, сортируется кэш сайтов по дате, а это очень удобно.

Down Or Not

Если вам необходим кэш сайтов в Интернете в связи с недоступностью того или иного ресурса, но поиски ни к чему не приводят, стоит проверить, не рядом ли с вами проблема. Например, провайдер Интернета выполняет технические работы или заменяет устаревшее оборудование. Для проверки, кто виноват, есть смысл воспользоваться сервисом Down Or Not (Жив или нет).

Введите адрес необходимого вам портала в строку поиска и нажмите на кнопку ENTER. После недолгого анализа сервис выдаст результат. Слово DOWN указывает на недоступность ресурса (временную или постоянную), если же на экране появится слово UP - значит, с порталом всё в порядке.

Down Ot Not выступает в роли стороннего и непредвзятого эксперта, чтобы определить, что именно является источником проблемы.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: