Rambler's Top100 Service
Elektronnye biblioteki, ob'edinyajtes'!


Хорошо с Горкотом жить!

Внимание! Приглашаю на сервер на моем ДОМАШНЕМ компьютере

      УВАЖАЕМЫЙ ПОСЕТИТЕЛЬ САЙТА! Если вы еврей по Галахе, обязательно прочтите это напоминание!       ВНИМАНИЕ! У меня с 03.04.2007 года введён в действие байесовский АНТИСПАМ фильтр. Вы можете смело посылать мне сообщения по е-майлу. Если вы не спаммер, я получу ваше сообщение!!!       Продолжается подписка на мою рассылку "Зачем он нужен, Интернет?" на моем сервере.       Политический хэрем голосовавшим за трансфер евреев!       Внимание! Добро пожаловать на Форум Бориса Бердичевского!

Рехавам Амикам Зеэви (Ганди)
Министр туризма Израиля, основатель партии "Моледет" Рехавам Амикам Зеэви (Ганди).
Трагически погиб 17 октября 2001 года от руки арабского подонка.
Да будет благословенна его память.
Да отомстит Г-дь за его кровь.
Партия "Моледет", Израиль.

Израиль, выборы, политика

Middle East MAOF

Если вы ищете книгу, я опубликую вашу просьбу о поиске.

EV Dental, P.C.
Если вы живете в Нью-Йорке или Нью-Джерси, лечите зубы только у моей сестры! Удобно, быстро, надёжно!

В рассылке - новости компьютерной литбиблиотеки Б.Бердичевского
скоро будет публиковаться роман Майн Рида "Роман долины реки Уай"!
Срочно подпишитесь:

(не забудьте вписать свой E-майл)

Рассылка производится непосредственно с домашнего сервера Бориса Бердичевского.

Zachem on nuzhen, Internet? Computernaya litbiblioteka

Auto Lat Koi-8R Win-1251 DOS MAC ISO

Официальная страница проекта Compulib

Что такое Compulib | Что нового | Автомат | История | Правила включения | Регистрация | Фреймы
Лист рассылки | Ссылки | Разное | Перекресток

Что такое Compulib ВВЕРХ

Речь идет о простой и довольно эффективной системе, позволяющей вести поиск в электронных библиотеках. Для этого используется стандартная искалка (Альтависта). Те, кто ведет библиотеки, заносят в свои страницы теги META по определенным правилам, после чего заносят эти страницы в Альтависту.

Для поиска используются специальные запросы к Альтависте или приведенный здесь пока еще не совершенный автомат.

В настоящее время в связи с тем, что движение по объединению электронных библиотек зародилось и развивается под знаком этой идеи, оно так и называется: движение Compulib.

Кроме того, под знаком Compulib возникло и продолжается обсуждение авторских прав в электронных библиотеках. Но об этом лучше читайте у Белонучкина.

Что нового на странице? ВВЕРХ

Внимание: на поиск по системе CompuLib не рассчитаны поисковики, не учитывающие при индексации тэг META. К таким относятся: www.google.ru, www.rambler.ru, www.yandex.ru. С системой CompuLib успешно ладят: www.altavista.com, www.aport.ru, а также Литпортал специально для поиска литературы в Интернете.

Автомат для поиска в AltaVist-e ВВЕРХ
Внимание! Скрипт автомата исправлен.
Замечено, что поиск именно на Альтависте дает наилучшие результаты!
Только главные страницы (LibMain) Автор (LibAuthor)
Книга (LibBook) Исключить мою библиотеку (-LibBorisba)
Исключить библиотеки ссылок (-LibLinks) Исключить тексты книг (-LibTexts)
Название произведения или автор
Если несколько слов, взять в кавычки, например: "Майн Рид"

Воспользуйтесь также поисковой системой по электронным библиотекам Юрия Сбитнева "Литпортал".

В начале 2000-го года открылся также очень интересный проект "Общий текст" с рассылкой на Subscribe.ru.

Появился подобный автомат и в библиотеке "Раскрытая книга" (Андрей Хроленок).

Как это начиналось ВВЕРХ

Факт, что в Интернете уже давно существует направление - ведение библиотек компьютерных текстов. Как-то раз я задался целью выяснить, можно ли найти что-либо в этих библиотеках с помощью стандартных искалок. Взял AltaVista, ввел в нее Майн Рид - и что же? Была найдена какая-то посторонняя страница, не имеющая отношения к библиотекам, где просто вскользь упоминался Майн Рид. Ничего путного не дал и поиск по-английски, тем более, что я не знал точно, как это пишется по-английски. Короче, уже позже мне удалось найти Майн Рида в библиотеках, но отнюдь не пользуясь искалкой.

Позже на основании этого мне пришла на ум такая идея. Что, если выбрать определенное ключевое слово, которое искалка заведомо не находит (например, "CompuLib"), и использовать его для "фильтрации" поиска, а заодно и для индикации всех страниц, содержащих библиотеки? Действительно, если внести это ключевое слово в тэг META:

<META NAME="keywords" CONTENT="CompuLib">

то поиск типа
+CompuLib +Майн +Рид

дает нужный результат, фильтруя весь мусор.

Напомню синтаксис АльтаВисты: плюс означает, что при показе результатов поиска необходимо обязательно включить данное слово, а минус - исключить.

Можно ввести и другие ключевые слова для упорядочения поиска через запятую, как, например:

<META NAME="keywords" CONTENT="CompuLib, LibAuthor, LibBook">

Можно ввести, к примеру, язык (English, Russian и т.п.), назначение библиотеки или раздела, характер содержимого ( Fantazi и т.п.) и прочее, прочее.

Далее приведены конкретные рекомендации.

Датой рождения идеи следует считать 4 сентября 1997 года, когда я послал письмо с такой идеей нескольким библиотекарям, в том числе и Мошкову.

На основании первых рекомендаций Мошкова я сделал следующие уточнения и дополнения.

Во-первых, вопрос о "case sensitive", т.е. важность больших и малых букв. Выяснилось, что в слове "CompuLib" большие и малые буквы важны. То же слово, написанное малыми буквами, при поиске в AltaVista давало 2 "мусорные" страницы. В принципе, ничего страшного. Следует иметь ввиду, что в строке поиска AltaVista можно задать поиск без "case sensitive", если слово дать малыми буквами. Из этого следует, что слово "CompuLib", набранное как вы его видите, даст нужный результат без мусора. Однако если кто-то и ошибется, набрав не теми буквами (напр. "compulib" или "сOMPULIB") - тоже не беда, можно поискать "compulib", и это будет найдено.

Во-вторых. У многих библиотечные страницы многоуровневые, и не на всех уровнях есть название книги или автора. Как быть? Если занести "CompuLib" всюду, это даст много мусора при поиске, а если занести выборочно, то нужная информация может быть не найдена.

Поэтому вначале я предложил ввести ключевые слова по уровням (типа CoLevel0, CoLevel1 и т.д.), однако в дальнейшем мы отказались от этой идеи, применив другие ключи.

Правила включения страниц в проект Compulib ВВЕРХ

1. Во всех страничках, вставляемых в проект, вводится таг META:
<META NAME="keywords" CONTENT="CompuLib, LibКлюч_ведущего, другие_ключевые_слова">

2. В корневых (главных) страничках предполагается наличие сведений о ведущем библиотеки или ссылки на такие сведения - для связи с организаторами проекта. В случае, если по какой-либо причине ведущий не желает этого делать, просьба связаться с организаторами проекта для координации. Желательно, чтобы такие странички были единственными в данной кодировке и в данном зеркале. Такие странички помечаются ключевым словом LibMain. Кроме того, каждому предлагается выбрать собственное ключевое слово (уникальное) по принципу LibКлюч_ведущего и помечать им все свои включаемые в проект страницы.
( Смотри Регистрация ключей библиотек compulib.)

3. Среди страниц, в которых упомянуты жанры произведений, ключом LibGenre помечаются те из них, из которых наиболее кратчайшим путем через ссылки можно попасть на список авторов/произведений в данном жанре, либо собственно такой список.

4. Среди страниц, в которых упомянуты авторы произведений, ключевым словом LibAuthor помечаются те из них, из которых наиболее кратчайшим путом через ссылки можно попасть на список произведений данного автора, либо собственно такой список.

5. Среди страниц, в которых перечислены названия книг(произведений) ключевым словом LibBook помечаются те из их, из которых наиболее кратчайшим путем через ссылки можно попасть на сами книги(произведения). Если книги записаны в формате HTML, по желанию ведущего можно ввести этот ключ в сами книги (в этом случае необходимо добавить и ключ LibTexts).

6. Если авторы, книги, жанры расположены на одной страничке - соответствующие ключевые слова указываются совместно, через запятую.

7. Если страницы содержат фреймы и невозможно индексировать их при помещении в поисковую систему, следует заготовить страницы каталогов, как указано далее. Аналогичную процедуру необходимо сделать и в случае отсутствия HTML страниц со ссылками на произведения (директории) в случае размещения библиотеки, к примеру, на ftp-сервере.

8. Если библиотека содержит большой процент внешних ссылок так, что ведущий не может гарантировать их целостность на протяжении времени, предлагается во все страницы проекта вставлять ключ LibLinks.

9. Если библиотека содержит произведения не полностью, фрагментами, ключ LibFrag вставляется в тексты произведений и/или в страницы, из которых есть прямые ссылки на такие тексты.
Предложение Дмитрия Лиадзе из Баку (ныне проживает в Германии).

10. Поисковая система на данном этапе - Альтависта. Подготовленные страницы вставляются в Альтависту с тем, чтобы через двое-трое суток можно было бы проверить это.

11. Стоит изучить прочие поисковые системы и составить сравнительную таблицу их особенностей с тем, чтобы знать, насколько они подходят для Compulib идеи. В таблицу включить в частности:

  • обработка (индексация) ключевых слов в META - есть/нет;
  • время в днях для отражения в датабазе;
  • стандарты синтаксиса для поискового запроса;
  • обработка различных русских кодировок;
  • обработка комментариев (т.е. включаются ли в индексацию слова из комментариев, обозначенных !- ... -!);
  • прочие особенности - достоинства и недостатки.

Очень хотелось бы связаться с разработчиками какой-либо русской искалки для разработки программного обеспения системы поиска по проекту Compulib непосредственно в искалке. -- Уже имеется система Литпортал Юрия Сбитнева.

12. Варианты запроса на поиск главных страниц:
"+CompuLib +LibMain"
Запрос на поиск авторов библиотек только в отдельных страницах с перечислением авторов:
"+CompuLib +LibAuthor -LibBook +<автор>"
без ограничений:
"+CompuLib +LibAuthor +<автор>"
Поиск названий книг:
"+CompuLib +LibBook +<книга>"
Поиск в библиотеках с исключением конкретных:
"+CompuLib +LibMain -LibBorisba" (к примеру).
Существуют и другие варианты запросов.

13. Действует бета-версия автомата на базе JavaScript. Предполагается сделать вариант автомата на Perl - Unix.

14. В связи с предложением по включению в проект библиотеки чертежей в формате Автокад преложено ключевое слово LibCad.

Регистрация ключей библиотек Compulib ВВЕРХ

На данный момент согласованные ключи библиотекарей:

Метод создания каталогов. Рекомендации ВВЕРХ

В этом разделе приведены рекомендации по включению библиотек в проект в сложных случаях, например, фреймовая структура.

К сожалению, еще никто не воспользовался этими рекомендациями :(

Допустим, страница библиотеки - не совсем обычная. Может, это фрейм, где указаны имена файлов, которые загружаются по мере необходимости. Например, у А.Зубарева главный HTML:

<html>
<head><title>AZ Lib</title>
<base target="_top">
</head>
<frameset cols=...
   <frameset rows=...
     <frame src=frame_main1.htm...
     <frame src=frame_main2.htm...
   </frameset>
   <frame src="trusk/" name=main3...
</frameset>
</html>

В frame_main1.htm описываются ссылки на авторов (выход на подкаталоги со списком их произведений).

При этом автоматически загружается фрейм с первым автором в списке при входе на страницу.

Для того, чтобы обеспечить загрузку любого автора из списка при загрузке, нужно прежде всего размножить главный HTML, задав разные стартовые фреймы.

Далее готовятся страницы-каталоги по числу авторов. В каждой такой странице указывается команда автоматического перехода типа:

<META HTTP-EQUIV="REFRESH" CONTENT="1; URL=http://...">

Задача, чтобы с соответствующей страницы-каталога мы автоматически попадали на одну из размноженных страниц А.Зубарева с открытым фреймом для соответствующего автора.

При этом в страницу-каталог следует занести известную META со всеми необходимыми ключами (CompuLib, LibAuthor, LibBook, автор,список названий книг).

Ключ LibMain можно занести, к примеру, только для первого по списку автора.

Эти каталоги и вставляются в Альтависту! Когда пользователь находит что-то в Альтависте, он автоматически попадает через каталог на комплексную страницу Зубарева с соответствующим фреймом - открытым автором!

Другой вариант - библиотека ftp без HTML оформления, но со списком файлов - файл-листом.

Мною написана программа, обрабатывающая файл-лист, хранящийся на ftp-архиве, и изготавливающая из него HTML-оформление, а заодно - вставляющая в HTML-ы нужные ключи - "CompuLib", "LibAuthor", "LibBook" и т.п. Такая программа написана специально для библиотеки Чорича и ему выслана.

Лист рассылки ВВЕРХ

Для тех, кто не еще знает, как подписаться: ознакомьтесь с правилами ведения списка и пошлите пустое письмо с субъектом "subscribe" по адресу compulib-request@sf.amc.ru

На данный момент возобновилось активное обсуждение в листе рассылки после некоторого затишья. Все желающие - присоединяйтесь к проекту!

Разное ВВЕРХ

Мошков придумал девиз:

Электронные библиотеки, объединяйтесь!

(а я его озвучил!)
(Да, призрак бродит по Интернету - призрак Compulib-а! :-)))
Этот девиз принят мной в качестве названия проекта, поскольку проект приносит двойную пользу: не только реализует описанную идею, но и объединяет библиотекарей в некоторое сообщество с общими интересами.

В свое время обсуждалась проблема разных русских кодировок в названиях авторов-книг. Пришли к выводу, что автомат будет переводить названия авторов в несколько кодировок (не на базе JavaScript, как здесь). Желательно, однако, чтобы библиотекари вводили в Альтависту свои страницы во всех кодировках - это не проблема для Альтависты!

Однако в конце марта 1998 АльтаВиста внесла поправки в систему кодировок, что облегчило нашу задачу.

Теперь страницы достаточно вводить в Альтависту в одном экземпляре в ЛЮБОЙ кодировке, а в автомате при обращении к АльтаВисте задается

&enc=cp1251

АльтаВиста тем самым берет на себя труд по распознанию вводимой кодировки.

Стоит изучить также возможности разных искалок (типа http://yandex.ru и прочих).

Пока ясно, что прочие искалки уступают Альтависте в оперативности корректировки датабазы и стандартности форматов запросов.

Возникла проблема, как быть, если авторы и книги указаны совместно, и некоторые авторы сдублированы в названиях книг. Решили, что в этом нет ничего страшного.

Ссылки ВВЕРХ

Нашей идеей заинтересовался Русский Журнал. Всем ведущим библиотек он адресует свое письмо.

Читайте также мою статью в РЖ!

В Русском журнале открыт проект Новости электронных библиотек.

Григорий Белонучкин открыл у себя страницу, посвященную Compulib.

Дискуссия, посвященная проблемам копирайта.

С 30 марта 1998 открыт Compulib Forum у Дмитрия Ватолина.

Воспользуйтесь также поисковой системой по электронным библиотекам Юрия Сбитнева "Литпортал".

И еще одна поисковая система по ЭБ - Библиографическая поисковая система Букинист Сергея Тарасова.

В начале 2000-го года открылся также очень интересный проект "Общий текст" с рассылкой на Subscribe.ru.

Все, кто ищет какую-то книгу, могут поделиться своими чаяниями на этом сайте. Возможно, там выполнят Ваш заказ на сканирование нужной Вам книги.

Не обращайтесь ко мне с просьбой о поиске книги, предварительно не заглянув на сайт "Общий текст"!

ПерекрестокВВЕРХ

Здесь будут помещаться различные мнения, включая дискуссионные, и моя реакция.

Григорий Белонучкин считает, что

Одно из основных моих разногласий с Борисом (инициатором Compulib) - следует ли всем, кто захочет применять у себя Compulibовские ключевые слова, вступать с нами в переписку, регистрироваться и т.п. Борис считает, что это, как минимум, желательно. А по-моему основное достоинство его идеи - то, что она может работать как открытая система. Каждый способен присоединиться к ней явочным порядком - просто вписав на страницу ключевые слова и послав ее адрес в искалку. Если он при этом что-то перепутает - никто кроме него особенно не пострадает.

На самом деле нет здесь никакой проблемы. Есть причины, чтобы страна знала своих героев, вот и все. Не вижу никакой проблемы, если кто-то подключится к проекту, не известив нас, но сделать это - в его же интересах!


Пишите мне - borisba@borisba.com ВВЕРХ

Return to Russian Page
Return to English Page
Гостевая книга на страницах Бориса Бердичевского
borisba@borisba.com

Thursday, January 20, 2005 17:25
These pages have been accessed   <Sorry, counter doesn't work>   times.

© Copyright Борис Бердичевский, проект Compulib