Архивные материалы сайта Vinedresser.info

Webarchive — веб-архив всего интернета и сайтов или машина времени на archive.org

Здравствуйте, уважаемые читатели блога KtoNaNovenkogo.ru. Не так давно я писал про то, что такое народная энциклопедия Википедия, которая безусловно заслуживает всяких лестных эпитетов, несмотря на присущие ей небольшие недостатки и критику ее статей со стороны научного сообщества.

Сам факт того, что некоммерческий проект уже не одно десятилетие трудится на благо всего интернет сообщества, заслуживает огромного уважения. Но в сети есть еще подобный масштабный проект, который не получая с этого дохода выполняет очень важную роль — сохраняет архивы сайтов, видео, аудио и печатной продукции.

Я говорю, конечно же, про web.archive.org — глобальный проект с казалось бы невыполнимой миссией — создание архива всех сайтов, когда либо размещенных в интернете. Причем, сайты сохраняются не в виде скриншотов, а в виде полноценно работающих веб-страниц со всеми ссылками, картинками и стилевым оформлением (CSS). Причем, для каждого сайта за время его существования в сети в этом архиве может накопиться и по несколько сотен копий, датированных разными этапами жизни ресурса.

Как можно использовать архив сайтов интернета

Чем же может быть полезен данный webarchive?

  1. Ну, во-первых, вы можете погрузиться в приятную ностальгию путешествуя по вашему сайту многолетней давности. Проследить историю изменений можно будет для любого другого ресурса интернета (например, я брал скриншоты для статей про уже умерший Апорт именно из это вебархива, да и скриншоты, иллюстрирующие эволюцию главной страницы Яндекса, имеют тоже самое происхождение).
  2. Но это не все. Если страница добавленного вами в закладки сайта не открывается, то вы, конечно же, можете попробовать вытащить ее из кеша Яндекса или Гугла (читайте подробнее про то, как лучше искать в Google). Но если ресурс недоступен уже очень давно, то такие мертвые ссылки нигде кроме archive.org открыть уже будет не возможно (правда, и там его может не оказаться по описанным чуть ниже причинам).
  3. Так же, если вы по каким-либо форс-мажорным обстоятельствам не делали бэкап (резервное копирование) вашего сайта, то данный web archive будет единственной возможностью восстановить свой сайт. Имеется возможность очистить все ссылки от привязки к web.archive.org и сделать их прямыми именно для вашего ресурса (читайте об этом ниже).

Ну, и последнее, что приходит в голову — поиск уникального контента. Если вы не способны сами создавать уникальный контента для сайта (писать статьи), то здесь вы сможете ими разжиться, правда, усилия приложить все равно придется. Суть такова, что многие сайты умирают и становятся недоступны вместе с имеющимся на них контентом.

Отыскав такие ресурсы вы сможете вытащить тексты из интернет-архива и разместить их у себя, предварительно проверив их на уникальность. Таким образом вы не занимаетесь плагиатом и не нарушаете авторские права (копирайт), но искать в вебархиве многим может показаться очень уж трудоемкой задачей.

Онлайн сервис Webarchive ведет свою историю аж с 1996 года. Поставленная перед проектом задача казалась невыполнимой даже с учетом того, что сайтов на то время в интернете было значительно меньше, чем сейчас (на несколько порядков). По началу, сайты архивировались не очень часто, но со временем, повышая мощности хранилищ, Веб-архив стал делать все больше и больше слепков сайтов.

Сам себя этот веб архив занес в базу лишь в 1997 году и выглядела его главная страница тогда так:

Сейчас на все про все (включая аудио, видео и отсканированные книги) у этой некоммерческой организации задействовано дисковое пространство чудовищных размеров, измеряемое десяткой с пятнадцатью нулями байт. Сайт имеет зеркала в различных дата центрах, а сам проект с недавних пор получил официальный статус библиотеки. Если рассматривать только архив страниц сайтов, то их уже там насчитывается около ста миллиардов (тут учитываются все слепки страниц когда-либо снятые и сохраненные).

На главной странице доступен не только архив страниц интернета Wayback Machine, но и архивы различных кинохроник, телепередач, аудио записей и отсканированных в различных библиотеках книг:

Но нас интересует именно область WEB с логотипом Wayback Machine. В расположенную там форму можно ввести URL или доменное имя интересующего вас сайта (читайте про то, что такое домен и чем он отличается от URL), чтобы попасть на страницу с календарем:

Из приведенного примера видно, что мой блог был впервые архивирован 27 августа 2009 года (через пять дней после регистрации (покупки) домена ktonanovenkogo.ru). За прошедший интервал времени было создано 125 архивных копий сайта, каждую из которым можно будет посмотреть и потрогать руками (осуществляя переходы по внутренним ссылкам).

Открытие мертвых ссылок и условия попадания сайта в archive.org

В календаре голубыми кружочками отмечены даты, в которые был создан слепок (вебархив) данного сайта. Естественно, что моменты снятия слепка никак не будет коррелироваться с производимыми на вашем ресурсе изменениями, и их время Webarchive определяет строго исходя из своих внутренних алгоритмов и таймеров.

Поэтому использовать архив интернета, как инструмент для открытия временно недоступных сайтов, наверное, не всегда будет резонным. Для этого у Яндекса имеется возможность просмотра архивной копии документа:

Да, и в Google можно всегда посмотреть сохраненную копию веб-страницы:

Данный же онлайн сервис понадобится в особо тяжелых случаях, когда искомая страница уже не существует и вряд ли уже будет существовать в реальном интернете, но зато она по прежнему будет доступна в машине времени.

Правда, тут должно быть соблюдено несколько условий того, чтобы сайт попал в archive.org:

Он не должен содержать в своем файле robots.txt запрет для его индексации роботом с web.archive.org. Такой запрет, обычно выглядит так:

Когда я писал статью про электронную почту mail.ru, то не смог найти в Архиве Интернета сохраненных копий сайта mail.ru, т.к. его файл robots.txt содержал в себе похожий запрет:

  • Некоторые сайты Вебархив по каким-либо причинам банально не нашел. Вероятность попадания ресурса в базу повышается, если он будет добавлен в каталог Dmoz или же если на него будут проставлены ссылки с других популярных ресурсов, которые в Webarchive уже находятся. В общем то, даже простой запрос через форму на главной странице этого сервиса может послужить толчком к привлечению внимания этого архиватора к вашему ресурсу.
  • Как найти нужный веб-архив и восстановить сайт без бекапа

    По архивам можно перемещаться и с помощью временной шкалы расположенной вверху страницы, где вертикальными черными черточками отмечены имеющиеся для этого сайта слепки. Иногда, веб-архивы могут быть битыми, тогда придется открыть ближайший к нему слепок.

    Щелкнув по голубому кружочку мы можем увидеть ссылки на несколько архивов, отличающихся временем их снятия.

    Возможно, что это делается во избежании потери данных за счет неизбежной порчи жестких дисков в хранилищах. Перейдя к просмотру одного из веб-архивов, вы увидите копию своего (в данном примере моего) сайта с работающими внутренними ссылками и подключенным стилевым оформлением. Правда, не идеально работающим.

    Например, кое-что из дизайна у меня все же перекосило и боковое меню работающее на ДжаваСкрипте полностью исчезло:

    Но это не столь важно, ибо в исходном коде страницы с web.archive.org это меню, естественно, присутствует. Однако, просто так скопировать текст этой страницы к себе на сайт взамен утерянной не получится. Почему? Да потому что путешествие внутри сайта из прошлого будет возможно лишь в случае замены всех внутренних ссылок на те, что генерит Webarchive (в противном случае вас перебросило бы на современную версию ресурса).

    Выглядят эти ссылки примерно так:

    Понятно, что можно будет вручную отсечь вступительную часть ссылок ( http://web.archive.org/web/20111013120145/ ), получив таким образом рабочий вариант. Можно этот процесс даже автоматизировать с помощью инструмента поиска и замены редактора Notepad, но еще проще будет воспользоваться встроенной в этот сервис возможностью замены внутренних ссылок на оригинальные.

    Для этого копируете адрес страницы с нужным слепком вашего сайта (из адресной строки браузера — начинается с http://web.archive.org/ ). Он будет иметь примерно такой вид:

    И вставляете в него конструкцию «id_» в конце даты ( 20111013120145 ), чтобы получилось так:

    Теперь измененный адрес обратно возвращаете в адресную строку браузера и жмете на Enter. После этого страница c архивом вашего сайта обновится и все внутренние ссылки станут прямыми. Можно будет копировать текст статьи из исходного кода вебархива.

    Понятно, что восстановление таким образом огромного сайта займет чудовищное количество времени, но когда другого варианта нет, то и такой покажется манной небесной. К тому же, страдают невозвратной потерей контента обычно только начинающие вебмастера, у которых этого самого контента было мало, а более-менее опытные сайтовладельцы, уж не раз обжигавшиеся на подобных вещах, делают бэкапы файлов и базы по пять раз на дню.

    Если вы захотите увидеть все страницы вашего (или чужого) сайта, которые содержатся в недрах этого мастодонта, то вам нужно будет вставить в адресную строку браузера следующий адрес и нажать Enter:

    Вместо моего домена можно использовать свой. На открывшейся странице вы получите возможность наложить фильтр в предназначенной для этого форме:

    Например, я захотел увидеть лишь текстовые файлы своего блога, которые заглотил Web Archive. Зачем — не знаю, но захотел.

    Как вытянуть из Webarchive уникальный контент для сайта

    Описанный ниже способ лично я не использовал, но чисто теоретически все должно работать. Саму идею я почерпнул на этом молодом ресурсе, где и были описаны все шаги. Принцип метода состоит в том, что каждый день умирают и никогда не возрождаются десятки сайтов.

    Причин этому может быть много и большинство из почивших в бозе ресурсов никакой особой ценности в плане контента никогда и не представляли. Но из всякого правила бывают исключения и нужно будет всего-навсего отделить зерна от плевел. Главное чтобы исчезнувшие сайты с более-менее удобоваримым контентом были бы представлены в Web Archive, хотя бы одной копией.

    Т.к. после смерти контент этих сайтов постепенно выпадет из индекса поисковых систем, то взяв его из интернет-архива вы, по идее, станете его законным владельцем и первоисточником для поисковых систем. Замечательно, если будет именно так (есть вариант, что еще при жизни ресурса его нещадно могли откопипастить). Но кроме проблемы уникальности текстов, существует проблема их отыскания.

    Во-первых, нам нужен список сайтов, которые скоро умрут или уже померли. Автор метода предлагает скачать с сайта регистратора доменных имен Nic.ru список освобождающихся или уже освободившихся доменов.

    Что примечательно, в последней колонке этого списка (его можно открыть в Excel) будет отображаться количество архивов, созданных для каждого сайта в Web Archive (правда, проверить наличие домена в веб-архиве можно и в ряде онлайн сервисов).

    Список буржуйских доменных имен, освобождающихся или уже освободившихся, предлагается скачать по этой ссылке. Ну, а дальше просматриваем содержимое сайтов, которое сохранил Web Archive и пытаемся найти что-то стоящее. Потом проверяем уникальность этих материалов (ссылку приводил чуть выше) и в случае удачи публикуем их на своем ресурсе, либо продаем в какой-нибудь бирже контента.

    Да, способ муторный и мною лично не проверенный. Но, думаю, что при некоторой степени автоматизации и обмозговывания он может давать неплохой выхлоп. Наверное, кто-нибудь уже это поставил на поток. А вы как думаете?

    Материалы в сети

    Материалы из разных архивов в сети

    Сообщений: 1344
    Регистрация: 2016
    Рейтинг: 3982

    Материалы с сайта familysearch.org в сети.

    “Каждому исследователю неплохо было бы копировать файлы на свое личное облако и при этом писать на форуме в региональных темах или в своем дневнике подробный перечень залитых документов, название церкви, географическое положение, АТД, фамилии жителей и т.д. Функция поиска по сайту и даже в обычных поисковиках творит чудеса”

    Ссылки на материалы по разным архивам

    Загрузки размещаются в:
    “FS_” / Страна / Архив / _Плёнки (Далее, плёнки постепенно сортируются, перемещаются в папки Страна / Архив / Фонд / Опись. )
    или
    “FS_” / Страна / Архив / Папки с номерами фондов и описей.

    На familysearch есть разные номера.
    Из столбца Микрофильм – это “физический” номер плёнки (микрофильма). обычно указан на 1-м кадре.
    Из столбца DGS – это цифровой номер, присвоенный плёнке при сканировании.
    На Google Drive загружены плёнки с использованием “физических” номеров (кроме плёнок, изначально снятых/сканированных на “цифру”).

    На форуме тема о доступе из России:
    http://forum.vgd.ru/1883/91627/
    Блокировка доступа обходится несколькими способами:
    1. Установка VPN- или прокси- дополнения (расширения) в браузер. Например Browsec.
    2. Использование браузера со встроенным VPN. Opera, TOR-browser, возможно Яндекс.Браузер.
    3. Добавление строк 204.9.224.11 www.familysearch.org и 204.9.224.11 familysearch.org в файл hosts.
    4. Частичное решение – использование адреса сайта www-a1.familysearch.org вместо www.familysearch.org

    Архивы, представленные на familysearch .

    Россия:
    Астрахань – Государственный архив Астраханской области, ГААО.

    Казань – Национальный архив Республики Татарстан, НА РТ.
    Список плёнок частичный – https://drive.google.com/open. i_NZmyFj_Q

    Карелия – Национальный архив Республики Карелия, Петрозаводск, НА РК. <1320 из >1330>

    Крым – Государственный архив Республики Крым в Симферополе, ГАРК.
    Разборка микрофильмов по Крыму – http://forum.vgd.ru/845/96487/0.htm?a=stdforum_view&o=

    Нижний Новгород – Центральный архив Нижегородской области, ЦАНО.

    Псков – Государственный архив Псковской области, ГАПО.
    microArt
    http://forum.vgd.ru/post/2678/83609/p2816020.htm#pp2816020
    Пленки Псковского областного архива (ГАПО), фонд 39. На Яндекс.Диск.

    РГИА – Российский государственный исторический архив, Санкт-Петербург, РГИА.
    Список плёнок – https://drive.google.com/file/. sp=sharing

    Самара – Центральный государственный архив Самарской области, Самара, ЦГАСО.
    |— Сызрань – филиал ЦГАСО, Сызрань (Самарская область)
    |— Тольятти – МКУ «Тольяттинский архив», Тольятти (Самарская область)
    Список плёнок по Самаре: ЦГАСО + Сызранский филиал ЦГАСО + архив Тольятти – https://drive.google.com/open. z8NbBEE0m9

    Тверь – Государственный архив Тверской области, ГАТО. <5554 из более 5655)

    Тобольск – Государственный архив Тюменской области в Тобольске, ТФ ГАТО. <2391 из . >
    Список плёнок частичный (архив Тюмени и Тобольска) – https://drive.google.com/file/. sp=sharing

    Томск – Государственный архив Томской области, ГАТО. <473 из . >
    Итоговая таблица расшифровки пленок по Томской губернии – https://forum.vgd.ru/606/104124/

    Тула – Государственный архив Тульской области, ГАТО.
    Список плёнок частичный (Фонды ImageViewer) – https://drive.google.com/open. sxMQuss2Td

    Удмуртия – Центральный государственный архив Удмуртской Республики, ЦГА УР. <2867 из . >
    Список плёнок – https://drive.google.com/open. xubwycLEwi

    Ульяновск – Государственный архив Ульяновской области, ГАУО.
    Список плёнок – https://drive.google.com/open. Ugat7kdCZ1

    ЦГИА СПб – Центральный государственный исторический архиве Санкт-Петербурга

    ЦГИАЛ – Центральный государственный исторический архив Украины город Львов.

    ГАДО (ДАДО) – Государственный архив Днепропетровской области в Днепропетровске, Украина.

    ГАДО (ДАДО) – Государственный архив Донецкой области в Донецке, Украина.

    ГАЗО (ДАЗО) – Государственный архив Закарпатской области в г. Ужгороде, Украина.

    ГАЗО – Государственный архив Запорожской области в Запорожье, Украине.

    ГАИФО – Государственный архив Ивано-Франковской области в г. Ивано-Франковске.

    ГАНО (ДАМО) – Государственный архив Николаевской области, Николаев, Украина.

    ГАСО – Государственный архив Сумской области, Сумы, Украина.

    ГАТО (ДАТО) – Государственный архив Тернопольской области

    ГАЧО (ДАЧО) – Государственный архив Черновицкой области, г. Черновцы, Украина (г. Чернівці, Україна).

    ГАЧО – Государственный архив Черниговской области в Чернигове, Украина.

    ГАЧО – Черкасский облгосархив.

    Беларусь:
    НИАБ в г. Минск – Национальный исторический архив Беларуси в г. Минск. <976 из . >
    Список плёнок – – https://drive.google.com/file/. sp=sharing
    НИАБ в г. Гродно – Национальный исторический архив Беларуси в г. Гродно.

    Австрия
    Австрийский военный архив (Kriegsarchiv). Вена

    Армения:
    Национальный архив Армении.

    Венгрия
    Венгерский национальный архив в Будапеште

    Грузия:
    Центральный государственный исторический архив Грузии

    Казахстан:
    ЦГА РК – Центральный государственный архив Республики Казахстан

    Киргизстан:
    Республиканский архив ЗАГСА (Бишкек)

    Латвия:
    National Archives of Latvia

    Литва:
    ЛГИА – Литовский государственный исторический архив в Вильнюсе.

    Молдова:
    НАРМ – Национальный архив республики Молдова в Кишиневе, Молдова

    Польша:
    Archiwum Archidiecezjalne w Poznaniu – 38
    Архивы Епархии во Влоцлавеке – 891
    Архивы Епархии в Ополе – 2
    Архивы Епархии в Плоцке – 192
    Архиепископский архив в Вроцлаве – 5
    Архиепископский архив в Гнезно – 9
    Архиепископский архив в Замостье – 191
    Архиепископский архив в Лодзи – 4
    Архиепископский архив в Любачеве – 31
    Государственный Архив Польши в Быдгоще – 3
    Государственный Архив Польши в Варшаве – 223
    Государственный Архив Польши в Калише – 1
    Государственный Архив Польши в Лодзи – 6
    Государственный Архив Польши в Плоцке – 10
    Государственный Архив Польши в Познани – 22
    Государственный Архив Польши в Пшемысле – 2
    Государственный Архив Польши в Сувалках – 2

    Эстония:
    National Archives of Estonia in Tallinn <7 из . >
    National Archives of Estonia in Tartu

    Belgique
    Национальный архив в Брюсселе – 1

    England
    London Metropolitan Archives – 1

    Germany
    Berlin – 5
    Berlin-Dahlem – 89
    Center for genealogy, Leipzig – 3
    Evangelische Kirche Groß Neudorf (Kr. Bromberg) – 3
    Evangelischen Landeskirchenamt Stuttgart – 4
    German Central Archive for Genealogy, Eibenstock – 2
    Kreisarchiv Erfurt – 3
    Kreisarchiv Gotha, Kreisarchiv Heiligenstadt – 2
    Kreisarchiv Langensalza – 3
    Kreisarchiv Schmalkalden-Meiningen – 1
    Protestant Landeskirchenamt Speyer – 4
    Protestant Landeskirchenamt Stuttgart – 4
    Staatsarchiv Magdeburg – 7
    Staatsarchiv Speyer – 1
    Zentralarchiv der Evangelischen Kirche in Hessen und Nassau, Darmstadt – 2
    Zentralstelle für Genealogie. Leipzig – 30

    Slovakia
    State Regional Archives in Bratislava – 3
    Государственный архив в Кошице – 3
    Государственный архив в Левоче – 45
    Государственный архив в Прешове – 51

    Spain
    Spain, Archivo Diocesano de Barcelona – 12
    Spain, Municipal Archive of Cádiz – 1
    Spain, Valencia, Municipal Archive of Torrente – 1

    USA
    USA, Delaware Public Archives in Dover – 1
    USA, Georgia Dept. of Archives and History, Atlanta, Georgia – 1
    USA, Library of Congress, Washington, D.C. – 12
    USA, Massachusetts State Archives, Boston, Massachusetts. – 1

    К некоторым плёнкам доступ закрыт:
    2 ГАЗО (ДАЗО) – Государственный архив Закарпатской области в г. Ужгороде, Украина (2422253, 2422428)
    1 ГАСО – Государственный архив Сумской области, Сумы, Украина (2161807)
    0 ГАТО (ДАТО) – Государственный архив Тернопольской области (2005250, 2005251 – Скорее всего плёнки из архива Польши)
    15 ГАЧО (ДАЧО) – Государственный архив Черновицкой области, г. Черновцы, Украина (г. Чернівці, Україна) (2187366, 2332119, 2332122, 2373833, 2394989, 2394990, 2395766, 2405190, 2405191, 2414145, 2414146, 2415439, 2415440, 2415478, 2426183)
    2 ЦГИАЛ – Центральный государственный исторический архив Украины город Львов (2377681, 2377697 + 2329193 – Скорее всего плёнка из архива Польши)
    35 ГАХО (ДАХО) – Государственный архив Харьковской области (5684458, 5684988, 5684989, 5684990, 5684991, 5684992, 5684993, 5684994, 5685041, 5685042, 5685043, 5685044, 5685045, 5685046, 5685047, 5685048, 5685076, 5685077, 5685078, 5685079, 5685080, 5685081, 5685108, 5685109, 5685110, 5685111, 5685112, 5685113, 5685114, 5685147, 5685148, 5685149, 5685150, 5685151, 5685152)
    2 Псков (1925492 и 1925498)
    1 Тверь (2067095 – нет номера DGS – значек катушки)
    99 ЛГИА – Литовский государственный исторический архив в Вильнюсе.
    137 НАРМ – Национальный архив республики Молдова в Кишиневе, Молдова. (2152808, 2152809, 2152810, 2152811, 2152812, 2152814, 2152816, 2152817, 2152819, 2152822, 2152823, 2152824, 2153831, 2153832, 2153833, 2153834, 2153835, 2153836, 2153838, 2153839, 2153841, 2153842, 2153843, 2153844, 2153846, 2153847, 2153848, 2153849, 2153850, 2153851, 2153852, 2153853, 2153854, 2154283, 2154284, 2154285, 2154286, 2154287, 2154288, 2154289, 2154290, 2154291, 2154292, 2154293, 2154294, 2154295, 2154298, 2154299, 2154300, 2154301, 2154302, 2154303, 2154304, 2159255, 2159256, 2159257, 2159258, 2159259, 2159260, 2159261, 2159262, 2159263, 2159264, 2159268, 2159269, 2159270, 2159272, 2159273, 2160699, 2160700, 2161876, 2161877, 2161878, 2161880, 2161882, 2161885, 2161887, 2292034, 2345660, 2345661, 2352407, 2352408, 2352409, 2352410, 2352413, 2352414, 2352415, 2352416, 2352417, 2352418, 2352419, 2352420, 2352421, 2352422, 2352953, 2352954, 2352955, 2352956, 2352957, 2352959, 2352960, 2352961, 2352962, 2352963, 2352964, 2352965, 2352969, 2352970, 2352971, 2352972, 2359451, 2359452, 2359453, 2359454, 2359455, 2359456, 2359457, 2359491, 2359492, 2359494, 2359495, 2378247, 2379080, 2379081, 2379082, 2379083, 2379668, 2379675, 2380856, 2382357, 2382908, 2382910, 2382969, 2382970, 2382971, 2382973, 2388766)
    154 Национальный архив Армении.

    Поиск среди уже загруженного на Google Drive по номеру плёнки (микрофильма). Поиск часто не срабатывает.

    В большинстве папок есть текстовый файл desc.txt, в котором указан номер плёнки, архив, номера дел и т.д.
    Эти данные индексируются в поиске Google Drive

    Нужно залогиниться в своём Google аккаунте, появляется строка поиска (без входа на сервисы Google строка поиска не отображается)
    Переходим один раз по ссылкам (чтобы ссылки появились в разделе “Доступные мне”)
    https://drive.google.com/drive. no0ZWEzMEU – “FS3”
    https://drive.google.com/drive. BzvKupgeDs – “FS4”
    Вводим в поиск номер плёнки, в результатах должен быть файл desc.txt
    Выделяем файл desc.txt. Снизу указывается ссылка на файл. Щёлкаем внизу на desc.txt, переходим к нужной папке.

    ntzmdem7v4xl@mail.ru – электронная почта admiral21 для вопросов.

    Дела на других файлообменниках:

    Web Archive: как посмотреть, как выглядел сайт раньше?

    • 0 14
    • 1 –>

    Интернет в привычном для нас виде появился 36 лет назад — за это время он развивался семимильными шагами, а сайты тысячи раз меняли свой дизайн и контент. Web archive представляет собой своеобразную машину времени, которой может воспользоваться каждый пользователь.

    Что такое Web Archive?

    Это бесплатный сервис, где собраны истории многих интернет ресурсов — их архивные копии. Причем речь идет не о скриншотах, а о полноценных страницах с изображениями, рабочими ссылками и стилевым оформлением.

    Получение информации о том или ином домене предполагает не только интересное времяпровождение с отслеживанием эволюции веб-проекта, но еще и возможность:

    • узнать тематику сайта — архив интернета демонстрирует содержимое, благодаря чему легко определить нишу проекта;
    • посмотреть, как выглядел сайт раньше — это находка для охотников за б/у доменами;
    • определить, регистрировался ли до этого анализируемый домен — полезный инструмент для тех, кому принципиальна «стерильность» домена или для того чтобы избежать санкций поисковиков;
    • восстановить свой сайт, если вы почему-то не сделали резервное копирование.
    • отыскать уникальный контент — трудоемкая задача, которая может подарить вам десятки бесплатных статей;
    • увидеть удаленный текст из закладок — шансы найти нужную страницу достаточно высоки.

    История создания архива интернета

    Wayback Machine является одним из двух главных проектов archive.org. Этот некоммерческий сервис был создан в 1996 году Брюстером Кейлом. Машина времени сайтов имеет четкую цель: сбор и хранение копий ресурсов вместе со всем контентом для возможности свободного просмотра несуществующих или неподдерживающихся страниц в будущем. С 1999-го робот стал фиксировать еще и аудио, видео, иллюстрации, программное обеспечение.

    База современного архива собиралась в течение 20 лет, у нее не существует аналогов. Статистика впечатляет: на сегодняшний день в сервисе находится 279 миллиардов страниц, 11 миллионов книг и статей, 100 тысяч программ и миллион картинок.

    А знаете ли вы? Веб-архив сайтов часто имеет проблемы на законодательном уровне из-за нарушения авторских прав. По требованию правообладателей библиотека удаляет материалы из публичного доступа.

    Как пользоваться веб-архивом?

    Сервис очень удобный в применении. Пошаговая инструкция такова:

    1. Зайдите на главную страницу платформы.
    2. Введите в поле название интересующего вас сайта и нажмите Enter (в нашем случае это https://livepage.pro).
    3. Под указанным доменным именем демонстрируется основная информация: когда начинается история проекта, сколько слепков имеет сайт. В примере видно, что ресурс был впервые архивирован 30 сентября 2017 года, библиотека хранит его 43 архивные копии.
    4. Дальше мы обращаем внимание на календарь — голубым цветом в нем отмечены даты создания слепков.Каждый из них доступен для просмотра: нужно лишь выбрать год, месяц и день сохранения. Мы хотим посмотреть, как выглядел сайт раньше: допустим, 3 февраля текущего года. Наводим курсор на голубой кружок и жмем на время сохранения. Проще не бывает!
    5. При желании можно получить общие данные о web-проекте — надо нажать на кнопку Summary над хронологической таблицей и календарем или же ознакомиться с картой сайта (кнопка Site Map).

    Алгоритм действий можно сократить. Для работы с сервисом напрямую, введите в строке своего браузера

    В нашем случае это

    Как восстановить сайт из веб-архива?

    Плохая новость для тех, кто планирует просто найти архив сайта и скачать его привычным способом: страницы имеют вид статических html-файлов, к тому же их слишком много для того, чтобы заниматься этим вручную. Решить проблему можно при помощи специальных программ, к примеру, приложения на ruby. Необходимо лишь установить все на сервер и запустить восстановление страниц.

    apt-get install ruby

    • Добавьте саму программу, необходимую для работы.

    gem install wayback_machine_downloader

    • Запустите выкачивание сайта из web archive.


    wayback_machine_downloader http://www.site.ru -timestamp 20131209110704

    Для удобства можно указать отметку снапшота — утилита определит число страниц и выведет выкачиваемые файлы на консоль. После скачивания и сохранения мы получим набор статических данных.

    • Разместите файлы в выбранной папке. Подойдет rsync:

    rsync -avh./websites/www.site.com/ /var/www/site.com/

    • Создайте конфигурацию в nginx и дождитесь обновления dns. На этом все!

    Как восстановить сайт без бэкапа?

    Вернуть ресурс из небытия можно даже без резервного копирования.

    • Как уже говорилось раньше, можно восстановить сайт из веб-архива https://archive.org. Чтобы получить все страницы, введите в специальное поле имя ресурса с добавлением /* (https://livepage.pro/*). Здесь же предусмотрена возможность фильтрации файлов по подстроке в URL. Для скачивания файлов подойдут многие программы, например, Teleport Pro.
    • Страницы интернет-проектов часто хранятся в кэше поисковых систем. По причине того что у каждого поисковика свои параметры, для лучшего эффекта промониторьте не только Google и Яндекс, но и Bing, Rambler:

    Войдите в режим расширенного поиска и укажите имя сайта. Получив результаты, кликайте по ссылкам «cached» или «копия».

    • Если вы отдаете полный RSS, тогда стоит проверить еще и ридеры, агрегаторы.

    Учтите!

    Нужный вам проект может и не входить в архив сайтов интернета. Если вы его не нашли в библиотеке — значит, правообладатель потребовал удаления копий или же ресурс закрыли в соответствии с законом о защите интеллектуальной собственности. Возможен и другой вариант: через файл robots.txt был банально внесен соответствующий запрет.

    Как найти уникальный контент из веб-архива для вашего сайта?

    Статьи, расположенные на заброшенных ресурсах, обычно не представляют никакой ценности для их бывших владельцев. А ведь в мир иной ежедневно уходят десятки сайтов. И среди кучи хлама, выброшенного на помойку истории, можно найти настоящие самородки — приличные тексты, которые достанутся вам бесплатно.

    Поисковики хорошо относятся к любому актуальному и уникальному контенту — можно не бояться попасть в их немилость только из-за того, что статьи взяты из веб-архива чужого сайта.

    Итак, последовательность действий следующая:

    1. Найдите подходящие вам блоги. Для этого следует зайти на Reg.ru и скачать оттуда список недавно освободившихся доменов.
    2. Посетите архив интернета с целью поиска сохраненных копий.
    3. Проверьте понравившиеся тексты через антиплагиат (контент может быть уже скопирован на другие сайты).
    4. Опубликуйте уникальные статьи на своем ресурсе.

    При разумном подходе такой способ пополнения сайта контентом можно поставить на поток. Поиски материалов на мертвых блогах оправданы экономией времени на написание текстов и денег, которые бы вам пришлось заплатить авторам.

    Как сделать так, чтобы сайт не попал в библиотеку веб-архива?

    Если вы дорожите контентом и не хотите видеть свою онлайн-площадку в электронной библиотеке, пропишите запретную директиву в файле robots.txt:

    User-agent: ia_archiver
    Disallow: /

    User-agent: ia_archiver-web.archive.org
    Disallow: /

    После изменения в настройках веб-сканер перестанет создавать архивные копии вашего сайта, к тому же удалит уже сделанные слепки. Однако учтите, что ваш запрет действует лишь до тех пор, пока доступен robots.txt — когда закончится срок регистрации доменного имени, машина времени сайтов станет демонстрировать статьи всем желающим.

    Важно! Если вы, наоборот, желаете активно пользоваться веб-архивом, введите соответствующий запрос на главной странице сервиса. Просто укажите адрес проекта в разделе Save Page Now, после чего нажмите кнопку Save Page. Повторяйте процедуру после внесения любых правок.

    Аналоги Webarchive

    Альтернативой рассматриваемой в обзоре электронной библиотеке может стать:

    HackWare.ru

    Этичный хакинг и тестирование на проникновение, информационная безопасность

    Веб-архивы Интернета: как искать удалённую информацию и восстанавливать сайты

    Что такое Wayback Machine и Архивы Интернета

    В этой статье мы рассмотрим Веб Архивы сайтов или Интернет архивы: как искать удалённую с сайтов информацию, как скачать больше несуществующие сайты и другие примеры и случаи использования.

    Принцип работы всех Интернет Архивов схожий: кто-то (любой пользователь) указывает страницу для сохранения. Интернет Архив скачивает её, в том числе текст, изображения и стили оформления, а затем сохраняет. По запросу сохранённые страницу могут быть просмотрены из Интернет Архива, при этом не имеет значения, если исходная страница изменилась или сайт в данный момент недоступен или вовсе перестал существовать.

    Многие Интернет Архивы хранят несколько версий одной и той же страницы, делая её снимок в разное время. Благодаря этому можно проследить историю изменения сайта или веб-страницы в течение всех лет существования.

    В этой статье будет показано, как находить удалённую или изменённую информацию, как использовать Интернет Архивы для восстановления сайтов, отдельных страниц или файлов, а также некоторые другие случае использования.

    Wayback Machine — это название одного из популярного веб архива сайтов. Иногда Wayback Machine используется как синоним «Интернет Архив».

    Какие существуют веб-архивы Интернета

    Я знаю о трёх архивах веб-сайтов (если вы знаете больше, то пишите их в комментариях):

    web.archive.org

    Этот сервис веб архива ещё известен как Wayback Machine. Имеет разные дополнительные функции, чаще всего используется инструментами по восстановлению сайтов и информации.

    Для сохранения страницы в архив перейдите по адресу https://archive.org/web/ введите адрес интересующей вас страницы и нажмите кнопку «SAVE PAGE».

    Для просмотра доступных сохранённых версий веб-страницы, перейдите по адресу https://archive.org/web/, введите адрес интересующей вас страницы или домен веб-сайта и нажмите «BROWSE HISTORY»:

    В самом верху написано, сколько всего снимком страницы сделано, дата первого и последнего снимка.

    Затем идёт шкала времени на которой можно выбрать интересующий год, при выборе года, будет обновляться календарь.

    Обратите внимание, что календарь показывает не количество изменений на сайте, а количество раз, когда был сделан архив страницы.

    Точки на календаре означают разные события, разные цвета несут разный смысл о веб захвате. Голубой означает, что при архивации страницы от веб-сервера был получен код ответа 2nn (всё хорошо); зелёный означает, что архиватор получил статус 3nn (перенаправление); оранжевый означает, что получен статус 4nn (ошибка на стороне клиента, например, страница не найдена), а красный означает, что при архивации получена ошибка 5nn (проблемы на сервере). Вероятно, чаще всего вас должны интересовать голубые и зелёные точки и ссылки.

    При клике на выбранное время, будет открыта ссылка, например, http://web.archive.org/web/20160803222240/https://hackware.ru/ и вам будет показано, как выглядела страница в то время:

    Используя эту миниатюру вы сможете переходить к следующему снимку страницы, либо перепрыгнуть к нужной дате:

    Лучший способ увидеть все файлы, которые были архивированы для определённого сайта, это открыть ссылку вида http://web.archive.org/*/www.yoursite.com/*, например, http://web.archive.org/*/hackware.ru/

    Кроме календаря доступна следующие страницы:

    • Collections — коллекции. Доступны как дополнительные функции для зарегистрированных пользователей и по подписке
    • Changes
    • Summary
    • Site Map

    Changes

    “Changes” — это инструмент, который вы можете использовать для идентификации и отображения изменений в содержимом заархивированных URL.

    Начать вы можете с того, что выберите два различных дня какого-то URL. Для этого кликните на соответствующие точки:

    И нажмите кнопку Compare. В результате будут показаны два варианта страницы. Жёлтый цвет показывает удалённый контент, а голубой цвет показывает добавленный контент.

    Summary

    В этой вкладке статистика о количестве изменений MIME-типов.

    Site Map

    Как следует из название, здесь показывается диаграмма карты сайта, используя которую вы можете перейти к архиву интересующей вас страницы.

    Поиск по Интернет архиву

    Если вместо адреса страницы вы введёте что-то другое, то будет выполнен поиск по архивированным сайтам:

    Показ страницы на определённую дату

    Кроме использования календаря для перехода к нужной дате, вы можете просмотреть страницу на нужную дату используя ссылку следующего вида: http://web.archive.org/web/ГГГГММДДЧЧММСС/АДРЕС_СТРАНИЦЫ/

    Обратите внимание, что в строке ГГГГММДДЧЧММСС можно пропустить любое количество конечных цифр.

    Если на нужную дату не найдена архивная копия, то будет показана версия на ближайшую имеющуюся дату.

    archive.md

    Адреса данного Архива Интернета:

    На главной странице говорящие за себя поля:

    • Архивировать страницу, которая сейчас онлайн
    • Искать сохранённые страницы

    Для поиска по сохранённым страницам можно как указывать конкретный URL, так и домены, например:

    • microsoft.com покажет снимки с хоста microsoft.com
    • *.microsoft.com покажет снимки с хоста microsoft.com и всех его субдоменов (например, www.microsoft.com)
    • http://twitter.com/burgerkingfor покажет архив данного url (поиск чувствителен к регистру)
    • http://twitter.com/burg* поиск архивных url начинающихся с http://twitter.com/burg

    Данный сервис сохраняет следующие части страницы:

    • Текстовое содержимое веб страницы
    • Изображения
    • Содержимое фреймов
    • Контент и изображения загруженные или сгенерированные с помощью Javascript на сайтах Web 2.0
    • Скриншоты размером 1024×768 пикселей.

    Не сохраняются следующие части веб-страниц:

    • Flash и загружаемый им контент
    • Видео и звуки
    • PDF
    • RSS и другие XML-страницы сохраняются ненадёжно. Большинство из них не сохраняются, или сохраняются как пустые страницы.

    Архивируемая страница и все изображения должны быть менее 50 Мегабайт.

    Для каждой архивированной страницы создаётся ссылка вида http://archive.is/XXXXX, где XXXXX это уникальный идентификатор страницы. Также к любой сохранённой странице можно получить доступ следующим образом:

    • http://archive.is/2013/http://www.google.de/ – самый новый снимок в 2013 году.
    • http://archive.is/201301/http://www.google.de/ – самый новый снимок в январе 2013.
    • http://archive.is/20130101/http://www.google.de/ – самый новый снимок в течение дня 1 января 2013.

    Дату можно продолжить далее, указав часы, минуты и секунды:

    • http://archive.is/2013010103/http://www.google.de/
    • http://archive.is/201301010313/http://www.google.de/
    • http://archive.is/20130101031355/http://www.google.de/

    Для улучшения читаемости, год, месяц, день, часы, минуты и секунды могут быть разделены точками, тире или двоеточиями:

    Также возможно обратиться ко всем снимкам указанного URL:

    Все сохранённые страницы домена:

    Все сохранённые страницы всех субдоменов

    Чтобы обратиться к самой последней версии страницы в архиве или к самой старой, поддерживаются адреса вида:

    Чтобы обратиться к определённой части длинной страницы имеется две опции:

    • добавить хэштег (#) с позицией прокрутки в качество которого число между 0 (вершина страницы) и 100 (низ страницы). Например, http://archive.md/dva4n#95%
    • выбрать текст на страницы и получить URL с хэштегом, указывающим на этот раздел. Например, http://archive.is/FWVL#selection-1493.0-1493.53

    В доменах поддерживаются национальные символы:

    Обратите внимание, что при создании архивной копии страницы архивируемому сайту отправляется IP адрес человека, создающего снимок страницы. Это делается через заголовок X-Forwarded-For для правильного определения вашего региона и показа соответствующего содержимого.

    web-arhive.ru

    Архив интернет (Web archive) — это бесплатный сервис по поиску архивных копий сайтов. С помощью данного сервиса вы можете проверить внешний вид и содержимое страницы в сети интернет на определённую дату.

    На момент написания, этот сервис, вроде бы, нормально не работает («Database Exception (#2002)»). Если у вас есть по нему какие-то новости, то пишите их в комментариях.

    Поиск сразу по всем Веб-архивам

    Может так случиться, что интересующая страница или файл отсутствует в веб архиве. В этом случае можно попытаться найти интересующую сохранённую страницу в другом Архиве Интернета. Специально для этого я сделал довольно простой сервис, который для введённого адреса даёт ссылки на снимки страницы в рассмотренных трёх архивах.

    Что делать, если удалённая страница не сохранена ни в одном из архивов?

    Архивы Интернета сохраняют страницы только если какой-то пользователь сделал на это запрос — они не имеют функции обходчиков и ищут новые страницы и ссылки. По этой причине возможно, что интересующая вас страница оказалась удалено до того, как была сохранена в каком-либо веб-архиве.

    Тем не менее можно воспользоваться услугами поисковых движков, которые активно ищут новые ссылки и оперативно сохраняют новые страницы. Для показа страницы из кэша Google нужно в поиске Гугла ввести

    Если ввести подобный запрос в поиск Google, то сразу будет открыта страница из кэша.

    Для просмотра текстовой версии можно использовать ссылку вида:

    • http://webcache.googleusercontent.com/search?q=cache:URL&strip=1&vwsrc=0

    Для просмотра исходного кода веб страницы из кэша Google используйте ссылку вида:

    • http://webcache.googleusercontent.com/search?q=cache:URL&strip=0&vwsrc=1

    Например, текстовый вид:

    Как полностью скачать сайт из веб-архива

    Если вы хотите восстановить удалённый сайт, то вам поможет программа Wayback Machine Downloader.

    Программа загрузит последнюю версию каждого файла, присутствующего в Архиве Интернета Wayback Machine, и сохранить его в папку вида ./websites/example.com/. Она также пересоздаст структуру директорий и автоматически создаст страницы index.html чтобы скаченный сайт без каких либо изменений можно было бы поместить на веб-сервер Apache или Nginx.

    Об установке программы и дополнительных опциях смотрите на странице https://kali.tools/?p=5211

    Пример скачивания полной копии сайта suip.biz из веб-архива:

    Структура скаченных файлов:

    Локальная копия сайта, обратите внимание на провайдера Интернет услуг:

    Как скачать все изменения страницы из веб-архива

    Если вас интересует не весь сайт, а определённая страница, но при этом вам нужно проследить все изменения на ней, то в этом случае используйте программу Waybackpack.

    К примеру для скачивания всех копий главной страницы сайта suip.biz, начиная с даты (–to-date 2017), эти страницы должны быть помещены в папку (-d /home/mial/test), при этом программа должна следовать HTTP редиректам (–follow-redirects):

    Чтобы для указанного сайта (hackware.ru) вывести список всех доступных копий в веб-архиве (–list):

    Как узнать все страницы сайта, которые сохранены в веб-архиве

    Для получения ссылок, которые хранятся в Архиве Интернета, используйте программу waybackurls.

    Эта программа извлекает все URL указанного домена, о которых знает Wayback Machine. Это можно использовать для быстрого составления карты сайта.

    Чтобы получить список всех страниц о которых знает Wayback Machine для домена suip.biz:

    Заключение

    Предыдущие три программы рассмотрены совсем кратко. Дополнительную информацию об их установке и об имеющихся опциях вы сможете найти по ссылкам на карточки этих программ.

    Ещё парочка программ, которые работают с архивом интернета:

    Сайты с архивными документами для составления родословной

    Где искать сайты с архивными документами, оцифрованными метрическими книгами и ревизскими сказками для составления родословной.

    Википедия

    В поиске оцифрованных документов поможет Википедия. Запрос на каждом языке выдаст список сайтов, баз данных актуальных для этой страны. Одна и та же статья при переключении языка содержит разную информацию и подборку ссылок.

    Например, «Генеалогические сайты» на украинском языке. Внизу страницы множество ссылок на сайты, содержащие оцифрованные метрические книги, ревизские сказки.

    Сайты с архивными документами для составления родословной. Статья на Википедии на украинском языке «Генеалогические сайты».

    «Список генеалогических баз данных» на английском языке включает информацию, которая поможет в составлении родословной.

    Перевод на русский язык английской статьи «Список генеалогических баз данных» , Сайт энциклопедии Википедия

    Тематические сайты и базы данных могут ссылаться друг на друга, могут быть связаны со статьей на Википедии.

    Поисковые системы

    Проблема в том, что сайты с оцифрованными документами практически не выдаются на первых позициях в поиске. Чаще всего описание к метрической книге не может конкурировать в тематике (это связано с поисковыми алгоритмами). Поэтому стоит проверять 3-7 страницы поиска.

    Поиск в Яндекс «Метрические книги Харьковской губернии онлайн» на третьей странице поисковых результатов выдает оцифрованные архивные документы.

    Существуют специализированные системы поиска записей о ваших предках. Найти ссылки на такие поисковые системы можно в статьях Википедии.

    Статья из Википедии » Генеалогические сайты » на немецком языке

    Ссылка ниже на поисковик сведений о предках взята из немецкой статьи.

    Сайты с архивными документами — поиск событий о людях по имени, фамилии, месту проживания: ggsearch.ml

    Зашли в тупик в поисках? Не знаете с чего начать писать историю семьи? Получите консультацию и конкретный план ваших действий! https://yulianovozhilova.ru/consult/

    Гугл книги

    Сайт books.google.ru, или гугл книги. Здесь вы не только найдете оцифрованные архивные материалы (как платные, так и бесплатные). Краеведческие книги, истории сел и городов, сборники материалов конференций по истории, генеалогии и прочее. Пробовать писать название нужно на разных языках.

    Гугл книги. Сайты с архивными документами, ревизскими сказками.

    Форумы

    Обязательно просматривайте всю тему по вашему вопросу на форуме ВГД целиком. Всё, что касается вашего уезда, района, регионального архива. Поверьте, проблемы с которыми вы сталкиваетесь в поисках – не уникальны. Кто-то когда-то уже искал эти сведения, задавал вопрос, делился своими гипотезами и ссылками.

    По той же причине я рекомендую записывать свои находки и советы на том же форуме. Когда-нибудь ваши находки помогут кому-то в составлении родословной.

    На региональных форумах исследователи родословной делятся ссылками, подсказками, рекомендациями по просмотру конкретных архивных источников.

    АИС архивов

    Электронная библиотека

    Государственные библиотеки имеют сайты, на которых можно просматривать архивные документы, справочники и краеведческие издания.

    Вам будут интересны другие статьи по генеалогии:

    Архивные материалы сайта Vinedresser.info

    Если кто не знает, в далеком 1996 году, американский программист и стартапер из Калифорнии Брюстер Кейл запилил самый большой в мире цифровой архив произведений литературы, музыки и искусства, который и по сей день продолжает архивировать разнообразный медиа контент.

    Управляет архивом некоммерческая организация Internet Archive. Доступ к данным архива бесплатный.

    Кроме литературных и музыкальных произведений библиотека интернета собирает и хранит архивные копии сайтов. По понятным причинам в архиве собраны не все до единого сайты мира и не за все даты. Поисковый робот системы, определяя возможность и частоту индексации сайтов, отдает предпочтение популярным ресурсам, но не смотря на это, в большинстве случаев в архиве удается найти архивные копии нужного сайта, даже если он мало известен.

    Русскоязычная версия Вебархива появилась в рунете в 2014 году.

    Вебархив на службе юристов и правообладателей

    Грамотные юристы в России и за рубежом давно смекнули, что в Вебархиве можно найти много информации, которая послужит доказательством в суде, даже если Ответчик удалил данные со своего сайта или изменил их.

    Порой и сами Ответчики прибегают к использованию Вебархива для возражения против необоснованных или завышенных требований Истца.

    Как правило, Вебархив используется для подтверждения следующих фактов:

    • Наличие или отсутствие правонарушения
    • Длительность правонарушения
    • Характер и обстоятельства правонарушения
    • Иные факты, имеющие правовое значение

    Как показывает практика, чаще всего данные из Архива Интернет используются для доказывания определенных обстоятельств по делам, связанным с защитой прав на объекты интеллектуальной собственности. По имеющимся у нас данным примерное соотношение споров, в которых используются архивные копии сайтов, мы отобразили на диаграмме

    Какие обстоятельства стремятся доказать юристы, с помощью Вебархива?

    • Незаконное использование товарного знака или коммерческого обозначения
    • Предложение к продаже товаров и услуг в сети интернет
    • Длительность нарушения на объекты интеллектуальных прав
    • Совершение Ответчиком действий, направленных на сокрытие следов правонарушения
    • Использование объекта интеллектуальных прав ранее даты предоставления ему правовой защиты
    • Установление сведений о надлежащем Ответчике
    • Установление связи между лицом фактически использующим сайт в настоящее время и фактическим правонарушителем

    А как суды оценивают данные из интернет архива ?

    Большинство судов в Российской Федерации знают и используют Вебархив в качестве источника получения доказательств.

    Суды принимают и рассматривают в качестве доказательств нотариально заверенные архивные копии сайтов, результаты автоматической фиксации информации, реже простые распечатки. Немало дел, где судьи не поленились непосредственно в судебном заседании исследовать Архив Интернета в порядке статьи 78 АПК РФ.

    Понятное дело, что тренды в подобных вопросах задает Суд по интеллектуальным правам (СИП РФ), рассматривающий одноименные споры, который неоднократно указывал следующее:

    • Согласно части 3 статьи 75 Арбитражного процессуального кодекса Российской Федерации документы, полученные посредством факсимильной, электронной или иной связи, в том числе с использованием информационно-телекоммуникационной сети «Интернет», а также документы, подписанные электронной подписью в порядке, установленном законодательством РФ, допускаются в качестве письменных доказательств в случаях и порядке, которые предусмотрены этим АПК РФ, другими федеральными законами, иными нормативными правовыми актами или договором.
    • Такие доказательства признаются относимыми, если дата фиксации содержащейся в доказательстве информации соответствует периоду доказывания, либо если фиксация осуществлена после предъявления искового заявления в суд, однако зафиксированная информация подтверждает существование в сети «Интернет» сведений о фактах, существовавших до даты направления соответствующего предложения. К числу последних относятся данные веб-архивов.
    • Главным критерием принятия в качестве надлежащего доказательства архивных копий интернет-страниц, полученных из веб -архивов, является, во-первых, невозможность вмешательства заинтересованных лиц (участников спора) в информационный ресурс, во-вторых, создание и использование сервиса именно для хранения информации о том, каким именно было содержимое интернет сайта.
    • Рассматривая дело №СИП-338/2017 в качестве суда первой инстанции, Суд по интеллектуальным правам в своем решении указал, что представленные Роспатентом распечатки сведений из веб-архива WayBackMachine (web.archive.org) содержат дату фиксации информации и адреса нахождения информации в сети Интернет (ссылки на сайты). Такие доказательства признаются относимыми, если дата фиксации содержащейся в доказательстве информации соответствует периоду доказывания, предшествующему дате подачи заявителем заявки на регистрацию спорного товарного знака, либо если фиксация осуществлена после предъявления искового заявления в суд, однако зафиксированная информация подтверждает существование в сети «Интернет» сведений о фактах, имеющих место быть до даты приоритета. К числу последних относятся данные веб-архивов, которые и были представлены Роспатентом в обоснование своих доводов.

    В 2017 году Суд по интеллектуальным правам выпустил Справку по некоторым вопросам, возникающим при оценке доказательств, содержащих информацию, размещенную в сети «Интернет» (утв. Постановлением Президиума Суда по интеллектуальным правам от 14.09.2017 № СП-23/24).

    В указанной справке СИП уделил немало внимания вопросам оценки архивных копий сайтов. Надо сказать, что в данной справке СИП занял весьма сдержанную позицию. Так в пункте 3.5.11 Справки указано:

    При представлении ответчиком по делам названной категории в подтверждение факта использования товарного знака путем предложения товаров и услуг доказательств, полученных с использованием сети «Интернет», в том случае, когда такие доказательства признаны относимыми, при проверке их достоверности суд учитывает, что интернет-ресурсы, оказывающие доступ к архивным копиям, как правило, указывают на то, что они не несут ответственности за достоверность представленной информации и ее идентичность информации, размещенной на сайте в конкретный период времени. Такие доказательства признаются достоверными при отсутствии возражений иных лиц, участвующих в деле. При наличии мотивированных возражений такие доказательства принимаются во внимание только в случае представления ответчиком иных доказательств использования товарного знака, которые оцениваются в совокупности и взаимной связи (постановление Суда по интеллектуальным правам от 13.02.2017 по делу № А56-21705/2016).

    Вместе с тем, непосредственно при рассмотрении споров, в которых стороны ссылаются на данные Архива Интернет, Суд по интеллектуальным правам практически во всех случаях положительно оценивает такие доказательства, несмотря на возражения противной стороны.

    Видимо причина в том, что составить мотивированные возражения против принятия архивных копий интернет-страниц довольно проблематично.

    Так, Арбитражный суд Тюменской области в решении по делу №А70-9233/2016 указал следующее:

    Таким образом, представленные в материалы дела истцом в целях защиты своего права архивные копии интернет-страниц, сохраненные на сайте www.web-arhive.ru, соответствуют требованиям, предъявляемым к доказательствам арбитражным процессуальным законодательством и в данной части доводы ответчика является не состоятельными

    Рассматривая кассационную жалобу по указанному выше делу, Суд по интеллектуальным правам пришел к следующему выводу:

    Суды первой и апелляционной инстанций обоснованно приняли во внимание в качестве доказательств того, что нарушение прав истца на спорное изобретение не прекращено ответчиком, представленные в материалы настоящего дела архивные копии (http://webarhive.ru) страниц сайта t72.ru; протоколы автоматизированного осмотра информации в сети Интернет Автоматизированной системой «ВЕБДЖАСТИС» за период с октября 2012 года по сентябрь 2016 года.

    Мы регулярно следим за судебной практикой по вопросу применения доказательств из Интернет в судах Российской Федерации, и в том числе за практикой использования в качестве доказательств заверенных архивных копий интернет-страниц. Регулярно заходите в наш блог и знакомьтесь с информацией по данной теме.

    Ссылка на основную публикацию