Анализ       Справочники       Сценарии       Рефераты       Курсовые работы       Авторефераты       Программы       Методички       Документы     опубликовать

Розділ Організація пошукових систем в автоматизованих електронних бібліотеках




Скачать 400.69 Kb.
НазваниеРозділ Організація пошукових систем в автоматизованих електронних бібліотеках
страница3/5
Дата01.10.2014
Размер400.69 Kb.
ТипДокументы
1   2   3   4   5
1. /3/teor/Висновки.doc
2. /3/teor/Вступление.doc
3. /3/teor/Додаток А.doc
4. /3/teor/Додаток Б.doc
5. /3/teor/Додаток В.doc
6. /3/teor/Доклад.doc
7. /3/teor/Реферат.doc
8. /3/teor/Роздел1.doc
9. /3/teor/Роздел2.doc
10. /3/teor/Роздел3.doc
11. /3/teor/Роздел4.doc
12. /3/teor/Роздел5.doc
13. /3/teor/Роздел6.doc
14. /3/teor/Роздел7.doc
15. /3/teor/Содержание.doc
16. /3/teor/Сокращения.doc
17. /3/teor/Список литературы.doc
18. /3/teor/титульник.doc
Інформації в базі даних. Розроблено систему перегляду та друку інформації про літературу І самої літератури. Розробити систему армб орієнтовану на роботу в ком-п`ютерній мережі, де велика кількість користувачів одночасно працює з одним сервером бази даних
Цей процес особливо активізувався на рубежі 1970-1980-х рр у зв'язку з появою й інтенсивним поширенням персональних електронно-обчислювальних машин
В.Є. Ходаков розробка автоматизованої інформаційної бібліотечної системи спільного факультету. Автоматизоване робоче місце бібліотекаря
Початковий код програмного продукту
Доклад Шановні голова та члени державної екзаменаційної комісії, дозвольте представити вашій увазі дипломний проект на тему: "Розробка автоматизованої інформаційної бібліотечної системи спільного факультету.
Задача побудови автоматизованої інфомаційної бібліотечної системи Херсонського державного технічного університету
Розділ Огляд базових концепцій організації автоматизованих інформаційно-бібліотечних систем
Розділ Організація пошукових систем в автоматизованих електронних бібліотеках
Розділ Концептуальна модель дипломного проекту 1 Постановка задачі
Розділ 4 Математичний опис розв’язуваної задачі
Розділ 5 Опис програмного продукту 1 Вибір мови програмування
7. 1 Аналіз умов праці
2. 1 Пошук розподіленої інформації
Балашов Е. П., Пузанов Д. В. Проектирование информационно-управляющих систем

Федеративні цифрові бібліотеки



Способи дозволу протиріччя між функціональністю і ціною залежать від контексту. Іноді цілком припустимо вибрати просту технологію і забезпечити широку, але неглибоку інтероперабельність. В іншому випадку більш мудрим було б обрати високотехнологічні і дорогі методи. На такий вибір здатні тільки високомотивовані ЕБ — але саме вони будуть надавати максимальні функціональні можливості. Термін "федеративна ЕБ" описує групу організацій, що працюють разом на формальній чи неформальній основі і підтримуючих визначений набір загальних сервісів і стандартів, досягаючи в такий спосіб максимальної інтероперабельності між собою. Партнери в такій федерації можуть мати різні системи і при цьому підтримувати погоджений список сервісів. При цьому необхідно погодити як технічні стандарти, так і політику (включаючи фінансові угоди, правила захисту інтелектуальної власності, безпеки і приватного життя).

Дослідження в університеті Іллінойсу (Urbana-Champaign) являють собою гарний приклад, що ілюструє проблеми інтероперабельності. За період 1994-1998 років, будучи учасниками Digital Libraries Initiative, команда дослідників з бібліотеки Graigner Engineering цього університету спробувала створити федеративну бібліотеку журнальних статей від декількох великих видавництв. Оскільки кожен видавець припускав використовувати розмітку SGML, представлялося, що це може послужити базою для такого проекту. Університет буде надавати ряд сервісів, наприклад, пошук, у той час як колекції будуть знаходитися у видавців. Проблеми виникли через те, що видавці використовували SGML по-різному. Кожний з них має власні визначення типів документів. Університет був змушений прикласти великі зусилля по перегляду семантики DTD як для витягу індексної інформації, так і для побудови погодженого користувальницького інтерфейсу. Це виявилося настільки складною задачею, що університет переорієнтувався на копіювання всієї інформації в єдину комп'ютерну систему з конвертацією в загальну DTD. Якщо шановна високопрофесійна дослідницька група університету стикнулася з такими труднощами, очікується, що в інших вони будуть не менше...


      1. Онлайнові каталоги і Z39.50


Багато бібліотек мають онлайнові каталоги своїх колекцій, що вільно доступні через Інтернет. Ці каталоги можна розглядати як форму об'єднання. Каталожні записи складаються у форматі MARC (відповідно до Правил англоамериканського каталогізіровання) і бібліотеки обмінюються ними для зниження витрат. Бібліотечне співтовариство розробило протокол Z39.50 для нестатків обміну, загального використання записів і розподіленого пошуку. У США, де Бібліотека Конгресу, OCLC і Research Library Group є найбільш активними в розвитку і поширенні цих стандартів, є також багато незалежних реалізацій Z39.50 на академічних сайтах чи в комерційних постачальників. Приналежність до цієї федерації, що створювалася багато років, коштує великих грошей, що "утворяться" в основному за рахунок економії від побудови і використання спільних каталогів. Одне з принципових призначень Z39.50 полягає в забезпеченні комутації між серверами. Каталожна система великої бібліотеки може використовувати цей протокол для пошуку потрібної роботи (її копії чи каталожного запису) у групі інших бібліотек. Користувачі можуть користатися клієнтом Z39.50 для пошуку в декількох каталогах чи послідовно одночасно. Бібліотеки і їхні клієнти одержують значну вигоду від такого використання загальних каталогів, незважаючи на те, що інтероперабельність між публічними каталогами залишає бажати кращого. Деякі реалізації Z39.50 мають опції, відсутні в інших версіях, однак першопричиною несумісності звичайно є те, що індивідуальні каталоги підтримуються людьми, що лояльні в першу чергу до свого місцевого співтовариства. Підтримка інших стандартів не є для них першочерговим пріоритетом. Навіть якщо організації використовують сумісні версії Z39.50, різниця в організації каталогів і способах їхнього представлення для зовнішніх користувачів залишається.
NCSTRL і Dienst

Об'єднаний каталог (union catalog) являє собою каталог, що містить запису про матеріали декількох бібліотек. Такі каталоги використовувалися в бібліотеках задовго до появи комп'ютерів і дозволяють виконувати розподілений пошук за рахунок об'єднання пошукової інформації в одному місці (каталозі). Служби пошуку у веб можуть розглядатися як об'єднані каталоги веб, навіть як один каталог з "сирими" записами. Альтернативний метод розподіленого пошуку полягає в тому, щоб кожна колекція мала свій пошуковий індекс. Пошукова програма посилає запити до цих окремих індексів і поєднує результати для представлення користувачу.

Мережна комп'ютерна реферативна бібліотека (Networked Computer Science Technical Reference Library, NCSTRL) являє собою федерацію колекцій ЕБ, що дуже важлива для вчених в області обчислювальної техніки. Вона базується на протоколі за назвою Dienst. Для мінімізації витрат на впровадження, цей протокол будується на декількох технічних стандартах, що вже знайомі професіоналам, що звичайно є просунутими користувачами Unix, Інтернету і веб. Перша версія Dienst посилала пошукові запити на усіх сервера. В міру збільшення їхнього числа від цього підходу довелося відмовитися - якщо один сервер був недоступний, страждала вся система. Зараз Dienst містить зведений (master) індекс, що є різновидом об'єднаного каталогу.

      1. Дослідження альтернативних підходів до розподіленого пошуку



Для федерацій колекцій чи успіх невдача рівною мірою визначаються як технічними, так і організаційними проблемами. Очевидно, що деякі члени надають сервіс більш високої якості, чим інші, а рівень підтримки сильно розрізняється. Однак якість сервісу не може визначатися гіршою організацією. У кожній інформаційній службі закладені визначені припущення про сценарії підтримки, формах припустимих запитів, варіантах відповідей. Вони реалізовані в таких інструментах, як пошук, перегляд, фільтри і вибірка (extract). Користувачу необхідна зв'язна персональна інформація; однак у розподіленому світі внутрішньо погоджені джерела інформації можуть розрізнятися друг від друга. Яким образом конгломерат організацій може надати користувачу ефективний доступ до своїх ресурсів? Яким образом служби, створені на основі різних концепцій, можуть надати ефективні кошти пошуку без воістину драконівської стандартизації? Навіть у випадку окремої централізованої служби залишаються технічні проблеми. Вони стають гігантськими, якщо джерела інформації контролюються незалежними організаціями.

Організаційні проблеми настільки великі, що заслоняють технічні аспекти. За винятком твердих федерацій, надія на краще майбутнє зв'язана з прийняттям технічних угод паралельно з прийняттям стратегій, на які поступово можуть перейти всі організації. Для кожного методу повинні існувати альтернативи низького рівня (звичайно, збереження статус-кво) так, щоб служби не припиняли продуктивної діяльності через окремі системи. Так, NCSTRL вважає своїм базовим протоколом Dienst, але більш половини її сайтов розміщають свої колекції також і на звичайних серверах з використанням FTP-протоколу.

Велика частина досліджень в області розподіленого пошуку полягає в спробах побудови зведених каталогів на основі метаданих від творців і видавців. Це було одним з мотивів створення Дублінського ядра. Необхідно об'єднати ці дані на комп'ютерній системі і згенерувати на їхній основі пошуковий індекс.

Інша область досліджень має на меті розробку методів звуження області пошуку в самих перспективних колекціях. Користувачі рідко хочуть шукати у всіх джерелах інформації в Інтернету. Вони хочуть провести пошук у конкретних категоріях, наприклад, у каталогах чи монографій індексах медичних досліджень. Виникає необхідність у коротких описах змісту окремих колекцій. Це особливо важливо коли доступ обмежений механізмами чи ідентифікації оплати. Якщо до джерела є вільний доступ, зовнішня програма (принаймні, теоретично) може генерувати статистичний профіль типів матеріалів і використовуваного словника. Якщо ж зовнішні користувачі мають доступ тільки через пошуковий інтерфейс, такий аналіз неможливий.

У 1996 році Luis Gravano зі Стэнфордського університету вивчав, яким образом клієнт може поєднувати результати з різних пошукових служб. Для цієї мети він запропонував протокол, названий STARTS. Він розроблявся в рамках спільного проекту Стэнфордського університету і ряду ведучих Інтернет- компаній. Те, як охоче компанії підтримали цю розробку показує, що вони розглядають концепції як фундаментально важливі для розширення можливостей пошуку в Інтернету. Відносно невеликі зусилля по стандартизації можуть привести до значного поліпшення цього сервісу.

У своєму аналізі Gravano розглядав інформацію в Інтернету як велике число колекцій матеріалів, причому кожна організована по-різному і кожна зі своєю пошуковою машиною (search engine). Фундаментальна концепція полягала в тім, щоб дозволити клієнтам використовувати всі широкі можливості цих пошукових машин і тих колекцій, що вони обслуговують. Проблема в тім, що ці програми різні, а колекції мають різні характеристики. Труднощі навіть не в тім, що інтерфейси використовують різний синтаксис, у результаті чого запити повинні переформулюватися при передачі в іншу систему. Різні самі базові алгоритми. Деякі використовують методи з булевими операторами; інші — методи з ранжируванням результатів. "Розвідувач", що повертає ранжирований список, не дає вказівок на те, яким образом обчислювалися ранги. Насправді, алгоритм ранжирування найчастіше є комерційним секретом. У результаті, ранжировані списки з різних джерел неможливо просто об'єднати. Ранжирування сильне залежить від набору слів, що використовуються в колекції; тому навіть об'єднання результатів із двох джерел, що використовують однаковий алгоритм ранжирування, сполучено з труднощями. Протокол STARTS дозволяє пошуковим машинам обмінюватися характеристиками їхніх колекцій і рангами, що вони генерують, тому клієнтська програма може спробувати звести воєдино результати з різних джерел.

1   2   3   4   5



Разместите кнопку на своём сайте:
Документы




База данных защищена авторским правом ©kiev.convdocs.org 2000-2013
При копировании материала обязательно указание активной ссылки открытой для индексации.
обратиться к администрации
Похожие:
Документы