Посторонним в

Блог-форум Винни Пуха
 
ФорумФорум  ЧаВоЧаВо  ПоискПоиск  ПользователиПользователи  ГруппыГруппы  РегистрацияРегистрация  ВходВход  

Поделиться | 
 

 Сохранение контента и его поиск на сервисах по архивированию

Предыдущая тема Следующая тема Перейти вниз 
АвторСообщение
Winnie
Admin


Сообщения : 1035
Дата регистрации : 2015-06-10

СообщениеТема: Сохранение контента и его поиск на сервисах по архивированию   2018-09-04, 17:29

(часть статьи Как архивировать материалы из открытых источников, 23 марта 2018)

Существуют две основных причины необходимости архивировать все цифровые свидетельства, применяемые в расследовании: сохранение их на случай удаления из оригинального источника и доказательство аудитории, что материал (если он был удален) действительно существовал в том виде, в каком вы его представляете. Скриншоты легко подделать, поэтому крайне важно найти способ сохранять материалы так, чтобы показать, что вы не могли изменить их содержание.

Для большей часть контента, в том числе постов в социальных сетях, новостных статей и других веб-страниц, имеется два сервиса, которые обычно срабатывают: Archive.today и Archive.org. Эти сайты сохраняют веб-страницы на собственных серверах, после чего они становятся доступны по ссылке. Кроме того, оба сайта сохраняют страницы на конкретный момент времени, поэтому можно наблюдать изменения между разными архивациями, например до и после вырезания информации из статьи. Мы рекомендуем сохранять материалы на обоих сайтах, чтобы максимизировать количество архивируемого контента. Мы кратко опишем работу обоих сайтов и их эффективность при архивировании страниц различных популярных социальных сетей. В целом Archive.today более приспособлен для сохранения страниц в социальных сетях, так как делает это через специально созданный аккаунт, тогда как archive.org видит только полностью публичные страницы, не требующие аккаунта.


Archive.today

Из двух основных сайтов-архиваторов Archive.is более эффективен при работе с социальными сетями. Однако он действует далеко не так давно, как archive.org. Его следует считать менее стабильным, поскольку он гораздо скромнее по масштабам. Кроме того, этот сайт заблокирован в различных странах, поскольку нежелательный для того или иного государства контент иногда распространяется через ссылки на archive.today. Альтернативные ссылки на этот сайт (Archive.is, Archive.li, Archive.ch…) позволяют обойти цензуру некоторых (но не всех) стран, например России, Китая и Финляндии.

Archive.today сохраняет страницы исключительно по запросам пользователей, а не автоматически, как Archive.org. Чтобы сохранить страницу на этом сайте, просто введите в поле в красном прямоугольнике ссылку на страницу, которую хотите сохранить.

Вы также можете архивировать страницы, сохранив закладку в вашем браузере, что позволяет сохранять в один клик страницы, на которых вы находитесь. Для этого сохраните новую страницу в ваших закладках (или избранном) со ссылкой:
Код:
javascript:void(open(‘https://archive.today/?run=1&url=’+encodeURIComponent(document.location)))

Теперь просто нажмите на вновь созданную закладку, чтобы сохранить любую страницу, открытую у вас в браузере.

Кроме того, можно перетащить кнопку на заглавной странице Archive.today на вашу панель закладок, и вы сможете сохранять страницы в один клик!


Еще одна полезная функция Archive.today — возможность сохранить целую страницу как изображение, даже если она очень длинная. Однако это не следует использовать как замену ссылке на архив, поскольку скриншоты можно редактировать после сохранения.

Archive.today относительно успешно архивирует страницы в социальных сетях, однако его работа далеко не идеальна. Как правило, заархивировать страницу социальной сети, защищенную некими настройками приватности, вроде «эту страницу могут видеть только друзья друзей» на Фейсбуке, с помощью сторонних архиваторов вроде Archive.today или Archive.org практически невозможно.


Archive.org

«Интернет-Архив», основанный в 1996 году, уже более 20 лет сохраняет веб-страницы и имеет значительный бюджет, что обеспечивает стабильность, на которую нельзя расчитывать в отношении Archive.today. Хотя у Archive.org есть множество замечательных проектов, в первую очередь нас интересует Internet Archive Wayback Machine, которая позволяет пользователям архивировать конкретные страницы и просматривать страницы, заархивированные другими пользователями.

В то время как Archive.today сохраняет страницы только по запросам пользователей, Archive.org использует как запросы пользователей, так и скрипты для автоматического сохранения страниц.

При сохранении обычных веб-страниц и новостных статей Archive.org часто дает фору Archive.today, поскольку позволяет переходить по клику на другие заархивированные страницы. Кроме того, на Archive.today гораздо меньше заархивированных страниц.

Но Archive.org хуже справляется с социальными сетями, чем Archive.today.

Примеры запросов при поиске контента. Для поиска конкретной страницы например http://opennet.ru/ в строке адреса браузера надо ввести https://web.archive.org/https://www.opennet.ru, но для поиска всех страниц данного сайта надо добавить символ "*", то есть https://web.archive.org/*https://www.opennet.ru* или https://web.archive.org/200502*/https://www.opennet.ru*.

https://web.archive.org/https://opennet.ru/stranica.html – открывает самую свежую копию указанной веб – страницы.

https://web.archive.org/2000/https://opennet.ru/stranica.html – откроет копию страницы, дата сохранения которой максимально близка к 1 июля 2000 года.

https://web.archive.org/200012/https://opennet.ru/stranica.html – откроет копию заданной страницы, дата сохранения которой максимально близка к 15 декабря 2000 года.

https://web.archive.org/20001231095510/https://opennet.ru/stranica.html – откроет копию заданной страницы, сделанную близко к указанной с точностью до секунды дате и времени.


Сохранение фото и видео

Ни Archive.org, ни Archive.today не могут сохранять фотографии и видео с Инстаграма и YouTube, а также испытывают проблемы при сохранении фотографий с Фейсбука, ВК и других сайтов. Поэтому, в случае такой необходимости, необходимо скачать материалы отдельно, а затем зафиксировать их подлинность с привязкой к конкретному времени.

Это можно сделать, прибегнув снова к помощи Archive.today, сохранив скриншот страницы с этим фото или видео, где отражены метаданные материала - название, дата загрузки, описание.

Как вариант, зафиксировать скриншот с привязкой к текущему времени можно, разместив его хеш в любом блокчейне. Для этого достаточно совершить любую транзакцию в сети, с текстом в виде хеша.

Для сохранения видеоконтента (и не только) можно также использовать сервис https://streamable.com/. Регистрация для этого необязательна. После загрузки файла будет получена ссылка на него.


См. также "Веб-архивы, как простейший способ обхода блокировки сайтов"
http://www.krassotkin.ru/articles/items/web_archiving_vs_censorship/
"Archive.today, Archive.org, Peeep.us и WebCite"
http://free.gta-ru.com/t117-topic#162
Вернуться к началу Перейти вниз
Посмотреть профиль http://free.gta-ru.com
 
Сохранение контента и его поиск на сервисах по архивированию
Предыдущая тема Следующая тема Вернуться к началу 
Страница 1 из 1

Права доступа к этому форуму:Вы не можете отвечать на сообщения
Посторонним в :: Инструментарий интернетов :: Ликвидация цензуры и рекламы-
Перейти: