Функционирует при финансовой поддержке Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации
Общество Важнейшим из искусств для нас являются электронные библиотеки

Важнейшим из искусств для нас являются электронные библиотеки

268
Фото с сайта ru.infocom.uz

В Рунете тестируется поисковая система для электронных библиотек - MBD Search Engine. В России вслед за Западом разгораются дискуссии об электронных библиотеках. Что это – зло, лишающее авторов и издателей законного вознаграждения за их труд, или добро? Добро, питающее умы и сердца многих миллионов людей, не имеющих возможность покупать книги и посещать библиотеки? Добро, которое не даст засохнуть талантам юных Ломоносовых в глубинке России?

Понятие электронной библиотеки сейчас неотделимо от Интернета и поисковых систем. Именно развитие этих двух информационных технологий открыло новые возможности и породило новые проблемы. Свой путь решения этих проблем предлагают московские специалисты, которые уже приступили к тестированию своей разработки в Интернете. О новом проекте рассказывает его руководитель, генеральный директор компании «MBD Soft», доктор наук Валерий Захарченко.

Зачем нужны специальные электронные библиотеки? Может достаточно самого Интернета?

- К сожалению, наряду с ценной информацией в Интернете накопилось огромное количество ненужной и неактуальной. При любом поиске на вас вываливается огромное количество мусора, в основном рекламного характера. Приходится копаться в этой куче, чтобы извлечь нужное. Чаще всего серьёзные и содержательные источники найти не удается. Электронная библиотека представляет собой информационное подпространство Интернета, очищенное от мусора и наполненное содержательными материалами. Особенно востребованы материалы научного, справочного, учебного характера.

Что означает аббревиатура МБД?

- МБД от «Машины Баз Данных». Происходит очень быстрое развитие рынка информации: электронных библиотек, текстовых баз данных, персональных и корпоративных архивов, электронных изданий. Поэтому мы создавали наши программы и поисковую систему MBD Search Engine как универсальное средство, способное интегрировать в своих базах любые первоисточники, от писем до энциклопедий, общим объемом в сотни и тысячи гигабайт.

Для электронных библиотек нужны какие то особые системы поиска? Ведь поисковых систем много, и в Интернете, и для персонального использования.

- Поиск в электронных библиотеках имеет свою специфику. Большинство известных поисковых систем разрабатывалось для поиска небольших документов: страничек в Интернете, писем в корпоративных архивах, библиографических описаний. Они и позиционируются как программы поиска документов. Не информации, а документа в целом. Ну, хорошо если на ваш запрос система выдала вам страничку в Интернете или письмо. Быстро загрузили, просмотрели и дальше. А если это книга, или, например, энциклопедия? Ничего себе документик. Ищи в нем. Поэтому те системы, которые в ответ на запрос выдают текст целой книги, или что ещё хуже, требуют загрузки файла с оригиналом документа (представляете время), для электронных библиотек мало пригодны. Это устаревший, не универсальный подход.

А как надо?

- Мгновенно надо выдавать. И не только весь документ, а нужные страницы. Ведь если вы даете ссылку, то говорите: загляни в книгу такую-то на страницу номер такой-то. Наша система именно так и делает. При создании базы наша программа извлекает всю информацию из файлов, разделяет её на отдельные страницы, как в книге, и сохраняет в базе данных. Кроме общей обработки документа, каждая страница индексируется отдельно. Поэтому при поиске сразу выдаются тексты нужных страниц в документе и возможен доступ к любой странице за сотые доли секунды. Конечно, для этого пришлось усложнить структуру базы данных. В нашей системе, кроме поисковых индексов, базы содержат файлы со сжатым и кодированным текстом всех документов. При поиске нет необходимости обращаться к исходным документам. Поисковая программа также устроена несколько сложнее, чем у большинства других систем, но зато работает быстрее и эффективнее. Её возможности позволяют перекрыть области применения от персональной системы до глобального поисковика.

Но ведь есть в Интернете и на CD энциклопедии с поиском. Чем они плохи?

- Есть. Но чтобы поисковая система могла работать с такими источниками, их перед вводом в систему структурируют и разделяют на множество мелких страничек - файлов. Работа эта трудоемкая и дорогая. Поэтому электронная версия газеты или журнала, это совершенно другой продукт, созданный по законам другого жанра – Интернет изданий. Для массового ввода электронных изданий в поисковую систему, такая технология не годится. Современный рынок требует другую технологию: когда на входе в базы поисковой системы могут быть любые файлы, например с исходной версткой журнала. А поисковая система должна все это переварить и обеспечить быстрый и удобный доступ к любой информации в базе.

Но ведь в книгах и журналах содержится множество изображений. Как же их просматривать без загрузки оригинала?

- Это ещё один важный момент работы с электронной библиотекой. Многие документы содержат графические изображения, необходимые для понимания документа. Журналы вообще трудно представить без графики. Поэтому мало обеспечить мгновенный доступ к тексту. Надо и с изображениями быстро работать. Наша система при индексировании любых источников извлекает из них не только текст, но и все изображения. Также как и текст, все изображения кодируются и сохраняются в специальном файле базы данных. При просмотре страниц документов, изображения отображаются на них в виде ссылок или уменьшенных копий. Кликнув на ссылке, вы вызываете из базы полноразмерное изображение без обращения к исходному документу. Всё это позволяет поддерживать очень высокую скорость работы с поисковой системой, недостижимую при использовании традиционных технологий.

Какие ещё требования к поисковым системам для электронных библиотек?

- Довольно много, разной степени важности. Нужен очень быстрый поиск. Для обычного ПК, одна – две секунды на поиск в ста гигабайтах текста. Поиск по сложным запросам с логическими операторами и, что очень важно, установка ограничения на расстояния между словами запроса, найденными в тексте. Что толку, если одно слово запроса будет найдено в начале книги, а другое в конце? Какая между ними связь? Ещё крайне важен пользовательский интерфейс системы. Есть системы, созданные очень известными фирмами, но с таким интерфейсом, что в страшном сне не приснится. Но самое актуальное требование к поисковой системе, от чего зависит судьба электронных библиотек вообще, это защита авторских прав. Поисковая система Google при осуществлении проекта всемирной библиотеки столкнулась с многочисленными исками со стороны авторов и издателей. Сейчас и в России возникают аналогичные конфликты, дискуссии и законодательные инициативы, грозящие по сути запретом электронных библиотек в существующем виде.

А есть ли предмет для дискуссий? Многие считают, что печатные книги намного удобнее экрана компьютера, и поэтому никогда не будут вытеснены электронными изданиями.

- Я понимаю людей, обожающих книги. Сам такой. Но молодые ребята больше привыкли смотреть на экран компьютера, чем в книжные страницы. Работать с ноутбуком, в том числе читать научную и художественную литературу уже сейчас вполне комфортно. Учитывая темпы прогресса в электронике, в скором времени качество изображения неизбежно превзойдет печатное. Но дело не только в качестве изображения. Я на своем ноутбуке в поисковой системе держу целый книжный мир. Свой персональный мир. Даже находясь в читальном зале самой лучшей и современной библиотеки, я не имею такой свободы доступа к нужной информации.

А как же издательства, типографии, книжные магазины, библиотеки, вся книжная, журнальная и газетная индустрия? Какое у них будущее?

- Их ещё надолго хватит. Сейчас электронные издания в Интернете только стимулируют продажи книг и играют роль рекламы. Даже когда у каждого ребенка будет по паре портативных компьютеров, все равно останется множество людей, предпочитающих напечатанные журналы и книги. Но это будет дорого, на любителя. Массовый потребитель будет переходить в Интернет и базы поисковых систем на DVD и других носителях. Конечно это революция, а суды между издателями и поисковыми системами, это начинающаяся гражданская война. Но издатели должны понять, что в их области наступают радикальные перемены, вызванные техническим прогрессом. В свое время аналогичная революция уже была, когда изобретение книгопечатания вытеснило рукописные книги. Переход от книгопечатания к Интернету, также неизбежен как замена рукописных книг печатными.

Возможно ли достижение согласия между электронными библиотеками и поисковыми системами с одной стороны и авторами с издателями с другой?

- Оно неизбежно. Просто впервые возник ряд проблем технического, правового и психологического свойства. Пока не будут приемлемые решения для всех сторон, то останутся и противоречия. С одной стороны нельзя просто так выкладывать в сети любые произведения. Такая политика может просто погубить литературу, лишив авторов доходов, также как бесплатность любых программ погубила нашу программную индустрию, возрождающуюся сейчас с огромным трудом. С другой стороны, нельзя лишать народ, особенно молодежь, доступа к литературе. Покупать книги это сейчас очень дорогое удовольствие, недоступное многим. Да и библиотеки есть не везде.

Где же решение?

- Мне кажется, что аналогию с программными продуктами можно продолжить и на маркетинг электронных изданий. На рынке предлагаются три категории программ: бесплатные, условно бесплатные и платные. Также и большая часть книг не защищена авторским правом и может находиться в бесплатном доступе. Условно-бесплатный доступ осуществляется в поисковых системах, когда произведение доступно частично, например отдельными найденными фрагментами, страницами и т.п. Наименее разработана схема платного доступа к ресурсам электронных библиотек в Интернете и на DVD. Ведь программы могут защищать себя сами, авторы могут встроить в них любой защитный механизм. Писатель этого сделать сам не может. Поэтому очевидно, что защита должна быть коллективной и соответствующая технология, избирательно работающая с разными категориями документов, должна быть встроена в программный комплекс поисковой системы.

В вашей системе есть такие возможнсти?

- Поисковые системы должны работать, всесторонне учитывая интересы авторов. В нашей системе мы много сил потратили на разработку программ, обеспечивающих защиту авторских прав. Каждый документ, будь то книга, статья или фото из многих миллионов хранящихся в базе, может иметь свои индивидуальные параметры. Автор может сам определять такие параметры как размер выводимого в результате поиска текстового фрагмента, блокирование вывода полноразмерных изображений, запрет на перелистывание полных страниц документов, блокирование загрузки исходного документа, ключ шифрования текста документа. Такой технологии пока нет ни у кого.

Может ли это полностью исключить воровство?

- Мне кажется, что насчет полного исключения воровства волноваться не стоит. Воровали и воровать будут всегда и везде. Программы взламывать, а книги сканировать, копировать и размножать. Но с другой стороны, это автоматически решает гуманитарную проблему доступа широких необеспеченных масс к сокровищам культуры и достижениям информационных технологий. Тут бесполезны и даже вредны всякие суровые законы и защитные технологии. Решать нужно проблему платного доступа обеспеченных слоев населения и корпораций к информационным ресурсам. Именно они финансируют всю мировую программную индустрию с её многомиллиардными доходами. Будут финансировать и электронные библиотеки, если им предложить соответствующую технологию платного доступа, в сочетании с продуманным законодательством.

Какие варианты платного доступа существуют?

- Первый, самый простой и распространенный, когда на каждого зарегистрированного пользователя на сайте библиотеки заводится персональный счет и папка - «личный кабинет» в которой выкладываются файлы, доступные по паролю только этому пользователю. Переводишь деньги со счета за книгу, её помещают в твой кабинет и, пожалуйста, скачивай, читай, пользуйся. Затем деньги делятся между автором и библиотекой. К сожалению, система хороша только для очень ответственных и законопослушных пользователей. К таковым относятся далеко не все, поэтому любая копия мгновенно копируется, расходится по друзьям и знакомым и так далее по цепочке.
В поисковой системе возможна подписка на работу в базе поисковой системы. Для этого пополняете свой счет в системе. При поиске вы просматриваете страницы того или иного издания. Количество загруженных страниц фиксируется и на счет владельцев издания переводится определенная ими плата, которая снимается с вашего счета. Если вы не зарегистрированы в системе, или имеете нулевой счет, то при поиске вам выдаются для просмотра только отдельные страницы или их фрагменты, а сплошное перелистывание и загрузка исходных материалов блокируются. Но несанкционированное копирование возможно и здесь.

Как можно предотвратить копирование?

- С помощью шифрования. Такой способ разработан в нашей компании и встроен в профессиональные версии программ MBD Search Engine. Каждое произведение как в Интернет базе, так и распространяемой на DVD шифруется специальным шифром. Это может быть личный шифр автора или издателя. Прочитать файл можно лишь получив электронный ключ, действительный только для одного компьютера пользователя. На любом другом компьютере прочитать его невозможно. Ключи может рассылать сам автор и непосредственно получать оплату. Можно это делать через поисковую систему. Это очень гибкий метод, позволяющий реализовать массу вариантов оплаты. Таким способом можно легко реализовать даже платную подписку на ежедневную газету в Интернете. Вы платите за персональный ключ и имеете свободный доступ ко всем материалам издания. Но только на своем ПК. Если вы скопируете любой материал на другой компьютер, то выведется белиберда. То же самое относится и к архивам на CD и DVD. Хотя все диски одинаковые, читаться они будут только на одном компьютере, при вводе ключа.

Возможны библиотеки с бесплатным доступом?

- Да, это так называемая рекламная модель. Мы как раз в начале июня запустили в режиме тестирования подобный проект в Интернете. Мы установили сервер с нашей поисковой системой. Для начала, на несколько сотен гигабайт. Сервер открыт для заполнения. Адрес: mbdse.ru. Можно бесплатно присылать в свои личные кабинеты, как отдельные произведения, так и архивы, собрания документов. К каждому документу или ко всей группе ваших файлов можно прикрепить рекламу, типа контекстной. Она выводится при показе любой страницы из вашего документа. При этом за каждый показ на счет автора должна начисляться плата. Деньги платят рекламодатели. И это могут быть очень немаленькие деньги. Поисковые системы основную часть своих доходов, составляющих миллиарды долларов, получают именно за контекстную рекламу. Мы назвали свою поисковую систему коллективной, потому что реально заработать по такой схеме она может только если соберется достаточно сильный коллектив информационных акционеров. Так что приглашаем и отдельных авторов и издателей и владельцев библиотек и баз данных для обсуждения возможностей сотрудничества.

А простые люди, не писатели и не издатели, могут участвовать?

- Любые пользователи могут присылать свои материалы. Основные требования: чтобы материалы были содержательного характера, не противоречили российскому законодательству и не дублировали уже имеющиеся. Можно присылать файлы самых обычных форматов. Материалы любого размера размещаются бесплатно. По сравнению с размещением вообще в Интернете, пользователь получает ряд преимуществ. Во-первых не нужно иметь собственный сайт в сети. В отличие от обычных поисковых систем предполагается ежедневное индексирование всех материалов. Пока еженедельное. Есть у вас файл с интересным материалом, заходите на наш сервер mbdse.ru, через минуту он у нас в базе, а завтра он уже в поисковом индексе и доступен всем пользователям. Пока система находится в режиме тестирования и полностью заработает где-то к концу года, но заполнение баз уже идет.

Может ли такой проект в России вырасти до размеров всемирной библиотеки Google?

- Совершенно не представляю. Руководствуюсь принципом: делай что должен и будь что будет. А вообще-то все начинается с разработки технологии и программного обеспечения. Вроде у нас они есть. Даже работают, хотя и в режиме тестирования. Всё что от нас зависит, мы сделаем. Сложность в другом: в организационных проблемах, в психологии потребителей, в компетенции законодателей. Например, дума готовит законопроект о запрете выкладывать в Интернете произведения без разрешения авторов. Это грозит закрытием большинству известных электронных библиотек, работающих вне собственной поисковой системы. Не уверен, что законодатели глубоко понимают проблему. Устранить нарушение авторских прав в Интернете таким способом невозможно, а усложнить жизнь собственным избирателям, вполне. Думаю, что проблема требует широкого обсуждения, а там уже можно и с Google конкурировать.

Есть ли смысл конкурировать с американскими проектами всемирной библиотеки? Может проще с ними кооперироваться?

- Американцы, в частности Google и Yahoo, вложили в свои проекты большие деньги. Расчет на то, что эти деньги многократно окупятся за счет рекламных возможностей проектов. И тут работает принцип конкуренции, а вовсе не сотрудничества. Дружить можно, но денежки, и владение технологиями будет врозь.

Во многих странах сейчас стараются наверстать свое отставание в этой области от американцев. Дело в том, что кроме коммерческих и утилитарных, существуют причины глобального характера, питающие проекты электронных библиотек. В связи с развитием информационных технологий, происходит быстрое перемещение всего культурного пространства: книг, прессы, музыки, фотографии, кино и прочего в Интернет, в поисковые системы и электронные библиотеки. А культура является проводящей средой для идеологического, экономического, политического влияния. Национальную безопасность определяет не только гонка вооружений, но и борьба за культурное пространство. Всем известно, что такое американские кино и теле индустрии, какое влияние они оказали и оказывают на весь мир. Поэтому, перефразируя классика можно сказать, что важнейшим из искусств для нас сейчас являются Интернет и электронные библиотеки.

Кого вы видите своими партнерами?

- Мы готовы сотрудничать со всеми. Особенно нам интересны издатели, созревшие для размещения своих изданий в поисковой системе, коллективной, или принадлежащей только им. Нам очень интересны некоммерческие проекты, гуманитарного или благотворительного характера. Для таких проектов мы готовы бесплатно предоставить программное обеспечение и техническую поддержку. Ознакомиться с версиями наших программ, скачать бесплатную версию, послать нам письмо, можно на нашем сайте www.mbdsoft.ru .

Беседовал Андрей Молчанов

ПО ТЕМЕ
Лайк
LIKE0
Смех
HAPPY0
Удивление
SURPRISED0
Гнев
ANGRY0
Печаль
SAD0
Увидели опечатку? Выделите фрагмент и нажмите Ctrl+Enter
Комментарии
0
Пока нет ни одного комментария.
Начните обсуждение первым!
Присоединиться
Самые яркие фото и видео дня — в наших группах в социальных сетях