Охота на книги: Поиск научной литературы в Интернете

Наконец-то доделал своё руководство по поиску научной литературы в Интернете. Текст основан главным образом на личном опыте, с небольшими исключениями, так что примеры используются соответствующие, но все сайты и программы, о которых идёт речь, — универсальны, они не привязаны к какой-то конкретной тематике и пригодятся представителям самых разных научных дисциплин. Последний раздел посвящён пиратским ресурсам (Sci-Hub, Library Genesis), в предпоследнем описывается, как использовать анонимную сеть TOR для обхода ограничений на доступ к книгам в Google Books и на Amazon.com, но основная часть текста посвящена легальным базам данных, благо с некоторыми из них в последнее время можно работать даже с домашнего компьютера через сайт какой-нибудь публичной библиотеки, в которую вы записаны. Плюс пара слов про поисковик Google Scholar и социальные сети для учёных. Ни в коей мере не претендую на полноту изложения, но мне самому перечисленные ресурсы довольно заметно облегчают жизнь. Надеюсь, что этот опыт пригодится и ещё кому-нибудь :-)

Загрузить полный текст (PDF, 9,5 Мбайт).

«БиблиоРоссика» — научная электронная библиотека на русском языке

Освоил ещё одну полезную электронную библиотеку — «БиблиоРоссика». Ресурс интересен тем, что он российский (хотя и является, судя по сайту, дочерним предприятием издательства Academic Studies Press) и содержит, соответственно, в основном книги на русском языке, но есть и иностранные. Всего в библиотеке сейчас около 18 тысяч документов. Художественной литературы нет, только научная и учебная — монографии, сборники, учебники, даже отдельные номера журналов, но немного. Видно, что сотрудничество налажено лишь с небольшим количеством издательств (по истории, например, очень много книг из «РОССПЭНа»). Будем надеяться, что со временем ситуация изменится к лучшему; для начала уже неплохо.

Доступ в «БиблиоРоссику» бесплатный для читателей тех «бумажных» библиотек, которые оплатили подписку. Например, для читателей Исторички ;-) Единственное неудобство — вам нужно будет один раз приехать самим в библиотеку и попросить, чтобы вас зарегистрировали. Поскольку старый корпус Исторички сейчас на ремонте, всё обслуживание читателей сосредоточено в бывшем зале периодики. Регистрацией в «БиблиоРоссике» занимаются сотрудники справочно-библиографического отдела. Логин и пароль вам пришлют на электронную почту.

БиблиоРоссика

Книги можно читать только непосредственно на сайте, загрузка недоступна. Можно распечатать или отправить по электронной почте часть книги (до 15%). Интерфейс для чтения книг работает в общем вполне прилично, при желании можно распахнуть его на весь экран. Книги на сервере хранятся в формате PDF, пагинация соответствует бумажному изданию.

БиблиоРоссика

Поиск по библиотеке доступен как простой, так и расширенный, имеется также рубрикатор, что довольно удобно. В результатах поиска для каждой книги указываются автор, заглавие, выходные данные и аннотация (или её начало), а также скан обложки. На страницу с результатами поиска по каждому запросу (также как и на любой раздел рубрикатора) можно сделать закладку в браузере и использовать её в дальнейшем для отслеживания новых поступлений. Отсортировать результаты по дате нельзя (порядок сортировки вообще довольно странный), но над изображением обложки выводится дата добавления книги в библиотеку.

Несколько полезных книг я здесь нашёл, кое-что уже успел отреферировать. Надеюсь, что и вам тоже пригодится :-)

Ebrary — легальная научная онлайн-библиотека иностранных электронных книг

Как известно, легальные коллекции научной литературы в Интернете в основном ограничиваются базами данных журнальных статей. Это безусловно полезно, но сопоставимых по охвату баз данных, которые содержали бы не статьи, а книги, давно и отчётливо не хватает. Пиратский LibGen эту проблему частично решает, но далеко не полностью; с художественной литературой ситуация заметно лучше. Так что появление на горизонте библиотеки с замечательным на русский лад названием Ebrary оказалось весьма приятной новостью.

База данных платная, но как и многие подобные ресурсы, позволяет библиотекам оплачивать подписку для своих читателей. Удобнее всего будет читателям Ленинки, поскольку они могут использовать Ebrary даже с домашних компьютеров. Процедура такая же, как и для ProQuest Dissertations & Theses, про которую я уже писал: достаточно просто выбрать Ebrary в списке внешних ресурсов на сайте Ленинки, имя пользователя — номер вашего читательского (полный, включая номер читального зала и нули, всего двенадцать цифр), пароль — дата рождения в формате ДДММГГГГ. На появившейся странице нужно согласиться с правилами, на следующей странице — ещё раз выбрать Ebrary. Аналогичная функция есть и на сайте Исторички, но через Ленинку доступно больше книг.

Библиотека содержит только иностранные книги, что как никогда актуально, поскольку бумажной научной литературы из-за границы в России в последние годы закупается совсем немного. Очень рекомендую зарегистрироваться на сайте. Это не избавит вас от необходимости авторизоваться через сайт Ленинки, но позволит завести виртуальную книжную полку и «откладывать» на неё заинтересовавшие вас книги, чтобы не искать их каждый раз заново. Теоретически книги можно даже загружать на свой компьютер, но только в формате PDF с DRM-защитой, так что для чтения таких файлов вам придётся дополнительно устанавливать Adobe Digital Editions, а каждый скачанный файл можно будет читать только в течение двух недель. Так что проще (на мой взгляд) читать книги непосредственно на сайте, хотя качество отрисовки текста и не слишком хорошее, в «БиблиоРоссике» лучше.

Интерфейс на английском языке, но несложный. Поддерживается простой и сложный поиск, имеется также рубрикатор. Небольшая тонкость: чтобы вызвать полную версию этого рубрикатора, нужно перейти на заглавную страницу библиотеки (ссылка Home вверху страницы) и именно оттуда пройти по ссылке All Subjects. Рубрикатор многоуровневый — например, интересующие меня книги находятся в категории History (General) and History of Europe → Russia. Soviet Union. Former Soviet Republics — Poland → History of Russia. Soviet Union. Former Soviet Republics → History → Soviet regime, 1918-1991. Содержимое рубрики, как и результаты поиска, можно сортировать по пяти параметрам, в том числе по релевантности и по дате. На каждую рубрику, так же как и на страницу с результатами поиска по каждому запросу, можно сделать закладку в браузере. Кроме того результаты поиска можно сохранять непосредственно в вашей учётной записи (кнопка Save Search). Всё вместе очень облегчает отслеживание новых поступлений.

Книг пока немного. В упомянутой уже рубрике “Soviet regime, 1918–1991” — всего шестьдесят три, причём последняя поступила почти два года назад. Тем не менее библиотека в целом продолжает пополняться, в нынешнем году новые поступления тоже были. Из нужных мне книг, которые я там нашёл, некоторых нет ни в московских библиотеках, ни в «Либгене», ни на Google Books. Для начала уже неплохо, надеюсь, что и вам тоже повезёт :-)

Напоследок, как обычно, несколько скриншотов, все кликабельные:

ebrary

Заглавная страница

ebrary

Содержимое рубрики

ebrary

Результаты поиска

ebrary

Книжная полка с отложенными книгами

ebrary

Подробные сведения о книге

ebrary

Текст книги

ProQuest Dissertations & Theses Global — всемирная библиотека диссертаций

По ходу дела осваиваю базу данных ProQuest Dissertations & Theses Global — крупнейшую в Интернете электронную библиотеку иностранных магистерских и докторских (Ph. D.) диссертаций. На Западе, как и в России, результаты диссертационных исследований нередко публикуются через несколько лет после защиты, а бывает, и вовсе не публикуются. Так что база данных ProQuest не только позволяет всем желающим их прочесть, но и даёт свой, весьма специфический срез информации по интересующей вас теме: если сравнить с библиографией опубликованных работ, то можно увидеть, какие диссертации уже «выросли» в монографии, а какие — ещё нет, над чем работают нынешние магистранты и докторанты и какие исследования, вероятно, ещё «дорастут» до типографии в ближайшие несколько лет. Заодно можно сравнить, как пишутся диссертации и дипломные работы в России и за рубежом.

Всего в базе более 1 миллиона 700 тысяч полных текстов, плюс ещё 3 миллиона 800 тысяч рефератов диссертаций по всем отраслям знания, защищённых в университетах восьмидесяти стран мира, глубина архива — до 1861 года, ежегодное пополнение — около 90 тысяч новых работ из 2700 научных организаций. Читатели Ленинки могут работать с базой даже со своих домашних компьютеров, авторизация производится через сайт библиотеки: нужно просто выбрать ProQuest Dissertations & Theses Global в списке внешних ресурсов, имя пользователя — номер вашего читательского (полный, включая номер читального зала и нули, всего двенадцать цифр), пароль — дата рождения в формате ДДММГГГГ. Очень удобно, рекомендую :-)

ДОКЛАД: Охота на книги: поиск иностранной научной литературы в Интернете

Мой доклад на Весконе-2015, содержит обзор трёх инструментов для поиска иностранной научной литературы в Интернете (LibGen, Sci-Hub, Academia.edu). Конвент был толкинистский, но доклад на самом деле будет интересен всем, кто занимается исследовательской работой, независимо от научных интересов.

Читать дальше ‘ДОКЛАД: Охота на книги: поиск иностранной научной литературы в Интернете’ »

Sci-Hub: загружаем статьи из научных журналов бесплатно

Пиратство в Интернете неистребимо. Буквально на днях узнал от коллег о появлении новой службы Sci-Hub для загрузки полных текстов статей из коммерческих научных журналов. Сайт находится по адресу http://sci-hub.org/ (упоминающиеся в Сети альтернативные адреса http://sci-hub.info/ и http://sci-hub.site50.net/ в настоящее время не работают). Интерфейс предельно простой: в поисковой строке на титульной странице сайта вводим URL статьи или журнала, DOI, PMID или просто поисковый запрос (удобнее всего использовать DOI) и нажимаем на поиск. Доступ к защищённым платным ресурсам осуществляется через систему прокси-серверов.

При работе с Sci-Hub следует помнить о его ограничениях, поэтому перед первым использованием обязательно прочтите справку (доступна по ссылке Как тут скачивать на титульной странице). Статьи, особенно в формате PDF, могут загружаться довольно долго — от 15 секунд до двух минут. Не все статьи доступны в PDF, бывает, что приходится ограничиться HTML-версией. Не ко всем статьям вообще удаётся получить доступ; в отдельных случаях система предлагает повторить попытку, используя другой прокси-сервер. Если требуется загрузить книгу или номер журнала целиком, то такую работу нужно выполнять строго поэтапно с обязательной сменой прокси-сервера после каждой статьи или главы и с перерывом на несколько часов после каждых 3—4 статей, статьи или главы выкачивать не по порядку, как в содержании, а вразброс — разработчики Sci-Hub опасаются, что в противном случае сайт могут забанить.

См. также: официальный анонс от разработчика системы.

ОБНОВЛЕНИЕ: В настоящий момент работающий адрес сайта — http://sci-hub.cc/. Старые адреса не работают.

Bookworm — новая онлайн-служба для загрузки книг с Google Books

Электронная библиотека Google Books в специальном представлении не нуждается. На данный момент она включает в себя около 15 миллионов книг и таким образом является крупнейшей в Интернете. В то же время Google вынужден идти навстречу владельцам авторских прав, поэтому при его использовании читатель сталкивается с двумя серьёзными проблемами: во-первых, многие книги находятся в так называемом ограниченном доступе, то есть посетителям доступны не все их страницы, а только часть; во-вторых, книги из Google Books нельзя сохранять на локальном компьютере. Новая онлайн-служба Bookworm (http://bookworm.evil.so/) была создана специально на этот случай; она позволяет решить не только вторую проблему, но частично также и первую.

Принцип работы Bookworm довольно прост. Дело в том, что если книга находится на Google Books в ограниченном доступе, то разные посетители в разное время видят разный набор страниц. Таким образом, просмотрев одну и ту же книгу несколько раз с разных компьютеров, можно постепенно вытянуть с сервера если и не все недостающие страницы, то, во всяком случае, значительную их часть. Bookworm имитирует именно такой многократный просмотр одной и той же книги, используя большое количество анонимных прокси-серверов.

Чтобы загрузить книгу через Bookworm, необходимо зарегистрироваться на сайте, зайти в свой личный кабинет, перейти в раздел Books, в поле Add new book указать адрес интересующей вас книги и нажать на кнопку Add. После того как Bookworm соберёт все страницы, до которых сумеет дотянуться, вы получите оповещение по электронной почте, а готовая книга появится в списке Processed books. Таким способом можно выкачивать книги, находящиеся в полном или ограниченном доступе. Если на Google Books хранится только информация об интересующей вас книге, а текст книги недоступен в принципе, Bookworm здесь не поможет. Бывают, однако, и такие ситуации, когда предпросмотр книги на Google Books доступен, но не всем пользователям или не во всех странах. Если вы не видите текст книги, но поиск по ней возможен, — это, скорее всего, как раз тот самый случай. Такие книги Bookworm вытаскивать умеет.

Готовые книги хранятся на сервере Bookworm в течение семи дней, их можно загрузить в виде PDF-файлов. Если нужную вам книгу уже кто-то скачивал менее семи дней назад, вы сразу получите готовый файл. Следует, однако, иметь в виду, что обычно загрузка одной книги с Google Books продолжается довольно долго, от 10—15 минут до месяца, чаще всего дней десять. Поэтому использовать Bookworm лучше в том случае, если интересующую вас книгу не удаётся достать иным, более оперативным способом. Кроме того, вы в любой момент можете загрузить PDF-файл, содержащий те страницы книги, которые уже удалось получить; поиск оставшихся страниц будет продолжаться до тех пор, пока вы его не остановите.

Вопрос о легальности Bookworm остаётся открытым. С одной стороны, никаких заведомо противозаконных операций он не выполняет, а всего лишь автоматизирует и тем самым ускоряет работу, которую большая группа пользователей из нескольких стран теоретически могла бы выполнить и вручную. С другой стороны, маловероятно, чтобы такое нестандартное использование Google Books входило в первоначальные планы его создателей. Пока, во всяком случае, Bookworm успешно функционирует. Хочется надеяться, что это надолго :-)

Электронная библиотека Library Genesis: «Гигапедия 2.0»?

На просторах Интернета появилась новая электронная библиотека Library Genesis (http://gen.lib.rus.ec/). Сайт размещается на сервере «Либрусека», зеркала доступны по адресам http://free-books.us.to/, http://libgen.info/ и http://www.libgen.info/ (интерфейс последних двух отличается от основного сайта). Справку можно найти по адресу http://gen.lib.rus.ec/wiki/, но её ещё не доделали. Библиотека предназначена в основном для научной, технической, справочной и учебной литературы. По словам создателей, их цель состоит в том, чтобы аккумулировать и систематизировать в рамках одного ресурса обширные «запасы» такого рода книг, накопившиеся за последние годы в Сети, но разбросанные по различным серверам. В настоящее время в библиотеке хранятся около 840 тысяч книг, в её состав импортированы фонды ряда других электронных библиотек, в том числе и закрытой несколько месяцев назад «Гигапедии» (Library.Nu).

Интерфейс Library Genesis довольно простой и, в общем, весьма логичный. На титульной странице размещена поисковая форма, поддерживается поиск по заглавию, автору, издателю, названию журнала или книжной серии, году издания, языку, ISBN, а также по контрольной сумме MD5, позволяющей точно идентифицировать файл. Кроме того, имеется тематический каталог (ссылка Topics); если там найдётся раздел, соответствующий вашим интересам, это заметно упрощает поиск. Отдельно можно отслеживать новые поступления (ссылка Last). Заявлена и RSS-лента, но пока не работает. Результаты поиска выводятся в удобной табличной форме, для каждого документа указываются автор, заглавие, издатель, год издания, язык, размер и формат файла, ссылки для скачивания и ссылка для редактирования каталожной карточки. Чтобы просмотреть карточку, нужно щёлкнуть мышкой по заглавию документа. В большинстве случаев там можно найти аннотацию и скан обложки. Для редактирования записей требуется регистрация, для скачивания книг — не требуется. Страницы могут выводиться с задержкой.

Теоретически все книги, имеющиеся в библиотеке, размещаются на четырёх зеркалах; в таблице результатов поиска каждому документу соответствуют четыре ссылки для скачивания. На практике часть ссылок обычно не работает; кроме того, возможны сбои непосредственно во время загрузки файлов, нужно быть к этому готовым. По идее, поддерживается и возможность скачивать книги через файлообменные сети eDonkey и BitTorrent (как по торрент-файлу, так и по magnet-ссылке), но с этим я пока не разобрался.

В общем и целом сайт производит приятное впечатление, авторы безусловно постарались. Будем надеяться, что имеющиеся технические недоработки со временем устранят, а сама библиотека продолжит пополняться и дальше. Можно сколько угодно рассуждать об интеллектуальной собственности и вреде пиратства, но Интернет по самой своей природе предназначен для свободного обмена информацией, и препятствовать ему — то же самое, что пытаться торговать воздухом. Для российских же читателей, учитывая явный дефицит иностранной литературы в библиотеках и магазинах, появление такого ресурса, как Library Genesis, будет, конечно, особенно приятной новостью.

Дополнение: Основной сервер библиотеки в настоящее время размещается по адресу http://libgen.org/. На http://gen.lib.rus.ec/ пока появляется только ссылка на форум библиотеки (http://genofond.org/). На этом форуме, кстати, в разделе Карта сайта можно найти актуальный список доступных зеркал.