Sci-Hub: загружаем статьи из научных журналов бесплатно

Пиратство в Интернете неистребимо. Буквально на днях узнал от коллег о появлении новой службы Sci-Hub для загрузки полных текстов статей из коммерческих научных журналов. Сайт находится по адресу http://sci-hub.org/ (упоминающиеся в Сети альтернативные адреса http://sci-hub.info/ и http://sci-hub.site50.net/ в настоящее время не работают). Интерфейс предельно простой: в поисковой строке на титульной странице сайта вводим URL статьи или журнала, DOI, PMID или просто поисковый запрос (удобнее всего использовать DOI) и нажимаем на поиск. Доступ к защищённым платным ресурсам осуществляется через систему прокси-серверов.

При работе с Sci-Hub следует помнить о его ограничениях, поэтому перед первым использованием обязательно прочтите справку (доступна по ссылке Как тут скачивать на титульной странице). Статьи, особенно в формате PDF, могут загружаться довольно долго — от 15 секунд до двух минут. Не все статьи доступны в PDF, бывает, что приходится ограничиться HTML-версией. Не ко всем статьям вообще удаётся получить доступ; в отдельных случаях система предлагает повторить попытку, используя другой прокси-сервер. Если требуется загрузить книгу или номер журнала целиком, то такую работу нужно выполнять строго поэтапно с обязательной сменой прокси-сервера после каждой статьи или главы и с перерывом на несколько часов после каждых 3—4 статей, статьи или главы выкачивать не по порядку, как в содержании, а вразброс — разработчики Sci-Hub опасаются, что в противном случае сайт могут забанить.

См. также: официальный анонс от разработчика системы.

ОБНОВЛЕНИЕ: В настоящий момент работающий адрес сайта — http://sci-hub.cc/. Старые адреса не работают.

Bookworm — новая онлайн-служба для загрузки книг с Google Books

Электронная библиотека Google Books в специальном представлении не нуждается. На данный момент она включает в себя около 15 миллионов книг и таким образом является крупнейшей в Интернете. В то же время Google вынужден идти навстречу владельцам авторских прав, поэтому при его использовании читатель сталкивается с двумя серьёзными проблемами: во-первых, многие книги находятся в так называемом ограниченном доступе, то есть посетителям доступны не все их страницы, а только часть; во-вторых, книги из Google Books нельзя сохранять на локальном компьютере. Новая онлайн-служба Bookworm (http://bookworm.evil.so/) была создана специально на этот случай; она позволяет решить не только вторую проблему, но частично также и первую.

Принцип работы Bookworm довольно прост. Дело в том, что если книга находится на Google Books в ограниченном доступе, то разные посетители в разное время видят разный набор страниц. Таким образом, просмотрев одну и ту же книгу несколько раз с разных компьютеров, можно постепенно вытянуть с сервера если и не все недостающие страницы, то, во всяком случае, значительную их часть. Bookworm имитирует именно такой многократный просмотр одной и той же книги, используя большое количество анонимных прокси-серверов.

Чтобы загрузить книгу через Bookworm, необходимо зарегистрироваться на сайте, зайти в свой личный кабинет, перейти в раздел Books, в поле Add new book указать адрес интересующей вас книги и нажать на кнопку Add. После того как Bookworm соберёт все страницы, до которых сумеет дотянуться, вы получите оповещение по электронной почте, а готовая книга появится в списке Processed books. Таким способом можно выкачивать книги, находящиеся в полном или ограниченном доступе. Если на Google Books хранится только информация об интересующей вас книге, а текст книги недоступен в принципе, Bookworm здесь не поможет. Бывают, однако, и такие ситуации, когда предпросмотр книги на Google Books доступен, но не всем пользователям или не во всех странах. Если вы не видите текст книги, но поиск по ней возможен, — это, скорее всего, как раз тот самый случай. Такие книги Bookworm вытаскивать умеет.

Готовые книги хранятся на сервере Bookworm в течение семи дней, их можно загрузить в виде PDF-файлов. Если нужную вам книгу уже кто-то скачивал менее семи дней назад, вы сразу получите готовый файл. Следует, однако, иметь в виду, что обычно загрузка одной книги с Google Books продолжается довольно долго, от 10—15 минут до месяца, чаще всего дней десять. Поэтому использовать Bookworm лучше в том случае, если интересующую вас книгу не удаётся достать иным, более оперативным способом. Кроме того, вы в любой момент можете загрузить PDF-файл, содержащий те страницы книги, которые уже удалось получить; поиск оставшихся страниц будет продолжаться до тех пор, пока вы его не остановите.

Вопрос о легальности Bookworm остаётся открытым. С одной стороны, никаких заведомо противозаконных операций он не выполняет, а всего лишь автоматизирует и тем самым ускоряет работу, которую большая группа пользователей из нескольких стран теоретически могла бы выполнить и вручную. С другой стороны, маловероятно, чтобы такое нестандартное использование Google Books входило в первоначальные планы его создателей. Пока, во всяком случае, Bookworm успешно функционирует. Хочется надеяться, что это надолго 🙂

Электронная библиотека Library Genesis: «Гигапедия 2.0»?

На просторах Интернета появилась новая электронная библиотека Library Genesis (http://gen.lib.rus.ec/). Сайт размещается на сервере «Либрусека», зеркала доступны по адресам http://free-books.us.to/, http://libgen.info/ и http://www.libgen.info/ (интерфейс последних двух отличается от основного сайта). Справку можно найти по адресу http://gen.lib.rus.ec/wiki/, но её ещё не доделали. Библиотека предназначена в основном для научной, технической, справочной и учебной литературы. По словам создателей, их цель состоит в том, чтобы аккумулировать и систематизировать в рамках одного ресурса обширные «запасы» такого рода книг, накопившиеся за последние годы в Сети, но разбросанные по различным серверам. В настоящее время в библиотеке хранятся около 840 тысяч книг, в её состав импортированы фонды ряда других электронных библиотек, в том числе и закрытой несколько месяцев назад «Гигапедии» (Library.Nu).

Интерфейс Library Genesis довольно простой и, в общем, весьма логичный. На титульной странице размещена поисковая форма, поддерживается поиск по заглавию, автору, издателю, названию журнала или книжной серии, году издания, языку, ISBN, а также по контрольной сумме MD5, позволяющей точно идентифицировать файл. Кроме того, имеется тематический каталог (ссылка Topics); если там найдётся раздел, соответствующий вашим интересам, это заметно упрощает поиск. Отдельно можно отслеживать новые поступления (ссылка Last). Заявлена и RSS-лента, но пока не работает. Результаты поиска выводятся в удобной табличной форме, для каждого документа указываются автор, заглавие, издатель, год издания, язык, размер и формат файла, ссылки для скачивания и ссылка для редактирования каталожной карточки. Чтобы просмотреть карточку, нужно щёлкнуть мышкой по заглавию документа. В большинстве случаев там можно найти аннотацию и скан обложки. Для редактирования записей требуется регистрация, для скачивания книг — не требуется. Страницы могут выводиться с задержкой.

Теоретически все книги, имеющиеся в библиотеке, размещаются на четырёх зеркалах; в таблице результатов поиска каждому документу соответствуют четыре ссылки для скачивания. На практике часть ссылок обычно не работает; кроме того, возможны сбои непосредственно во время загрузки файлов, нужно быть к этому готовым. По идее, поддерживается и возможность скачивать книги через файлообменные сети eDonkey и BitTorrent (как по торрент-файлу, так и по magnet-ссылке), но с этим я пока не разобрался.

В общем и целом сайт производит приятное впечатление, авторы безусловно постарались. Будем надеяться, что имеющиеся технические недоработки со временем устранят, а сама библиотека продолжит пополняться и дальше. Можно сколько угодно рассуждать об интеллектуальной собственности и вреде пиратства, но Интернет по самой своей природе предназначен для свободного обмена информацией, и препятствовать ему — то же самое, что пытаться торговать воздухом. Для российских же читателей, учитывая явный дефицит иностранной литературы в библиотеках и магазинах, появление такого ресурса, как Library Genesis, будет, конечно, особенно приятной новостью.

Дополнение: Основной сервер библиотеки в настоящее время размещается по адресу http://libgen.org/. На http://gen.lib.rus.ec/ пока появляется только ссылка на форум библиотеки (http://genofond.org/). На этом форуме, кстати, в разделе Карта сайта можно найти актуальный список доступных зеркал.

Новые ссылки

AvaxHome — рубрицированный и аннотированный каталог ссылок на файлы (в том числе книги), размещённые на файлообменниках. Здесь доступна и научная литература, в том числе иностранная. Будем надеяться, что он позволит хотя бы частично заменить отнятую у нас «Гигапедию»…

http://freeproxysevers.com/ — общедоступный прокси-сервер, позволяет посещать различные веб-ресурсы под изменённым (и при том не российским) IP-адресом. Может пригодиться, например, при работе с Google Books и некоторыми другими ресурсами, на которых часть материалов может быть недоступна для российских пользователей.

http://millionproxies.com/ — каталог таких же прокси-серверов.