понедельник, 27 января 2014 г.

Поняття про пошукові технології системи Internet та їх класифікація - Реферат

Поняття про пошукові технології системи Internet та їх класифікація
Поповнення інформаційного ресурсу Internet відбувається швидкими темпами, тому знайти необхідну інформацію стає все важче. Різноманітні друковані довідники старіють ще до їх появи у торгівельній мережі. Єдиним надійним способом пошуку інформації є використання спеціальних пошукових методів та технологій, які постійно слідкують за зміною інформаційного ресурсу мережі.
За час існування мережі Internet робились різноманітні спроби організації пошукових технологій. Багато з цих спроб виявилися невдалими, інші привели до створення зручних технологій пошуку інформації. Найефективніші технології пошуку з'явилися в останні два-три роки. Загалом у світі існують сотні різноманітних пошукових технологій, тому вибір тієї чи іншої технології та її пошукової системи залежить від компетентності користувача та його особистих уподобань.
Багато пошукових технологій дозволяють шукати інформацію не тільки на Web-сторінках, але й в групах новин, сховищах файлів мережі Internet. Таким чином, в результаті пошуку можна знайти повідомлення в групі новин або який-небудь файл. Тому зручнішим є застосовувати замість терміна "сторінка" більш загальний термін "документ". Під документом треба розуміти Web-сторінку, повідомлення чи файл, що вміщує ту чи іншу інформацію.
В Internet пошукові технології можна класифікувати за групами, за допомогою яких здійснюється пошук документів:
1. Пошук за допомогою систем FTP, Gopher, Archie, Veronica тощо;
2. Пошук за допомогою "жовтих" та "білих" сторінок Internet;
3. Пошук за допомогою каталогів;
4. Пошук за допомогою пошукових машин;
5. Пошук за допомогою метапошукових машин;
6. Пошук за допомогою програмних агентів;
7. Пошук за допомогою професійних служб пошуку.
Розглянемо ці технології пошуку.
Перша технологія.
В Internet створені спеціальні Web-вузли FTP, на яких знаходяться програми, графічні та звукові файли й інша цінна інформація.
Вузол FTP-search
Предметний.
При роботі з ним необхідно знати ім'я файлу, що відшукується.
Вузол Snoopie
Адреса: http://www.snoopie.com Найшвидший предметний покажчик пошуку вузлів FTP.
За допомогою архівів Gopher краще всього знаходити текстові ресурси, наприклад, книги, статті тощо. Для пошуку в архівах Gopher можна використовувати такі вузли: Alex, Archie, Veronica та Galaxy.
Технологія "жовтих" сторінок.
Жовті сторінки Internet використовують ту саму концепцію, що й однойменні телефонні довідники, й призначені для полегшення пошуку в мережі шляхом розподілення їх за визначеними темами.
Більшість "жовтих" сторінок упорядковані за темами та надають користувачеві назви вузлів та їх опис, а також URL. Найбільш популярні довідники:
" Official World Wide Web Yellow Pages від New Riders;
" The Internet Yellow Pages від McGraw Hill;
" McKinley Yellow Pages від New Riders.
Взагалі існує багато видань подібного типу, що містить інформацію про вузли Web. Вартість таких довідників становить US$25-50.
Пошук за допомогою каталогів.
Каталоги - це вузли Web, які вміщують предметні покажчики інформації про інші вузли, доступ до яких важливо отримати за допомогою перегляду або пошуку. Завдяки розбивці даних на різноманітні категорії, забезпечується можливість звуження пошуку доки не буде отримано необхідний документ.
Найпопулярнішим є каталог Yahoo, що має множину категорій та підкатегорій. З його допомогою можна виконати пошук за визначеним критерієм в цілому каталозі або його підкаталозі.
Інші каталоги, такі як Magellan, Excite, надають у ваше розпорядження переліки вузлів, інформацію про них, різні статті, книги, новини (як внутрішні, так і міжнародні) тощо.
Крім того, можна використовувати комерційні каталоги для отримання інформації про місцезнаходження товарів та послуг. Комерційними каталогами є Apollo, Linkstar та інші. В таблиці 1 наведено перелік основних каталогів.
Таблиця 1. Перелік основних каталогів
№ Назва Адреса Призначення
1. Apollo http://apollo.co.uk
Комерційний
2. Excite Netdirectory http://www.excite.com
Бібліотечний
3. Galaxy http://galaxy.einet.net
комерційний та бібліотечний
4. Linkstar http://www.linkstar
Комерційний
5. Point.com http://point.com
Загального призначення
6. Yahoo http://www.yahoo.com
Загального призначення
7. Clearing House http://www.lib.umich.edu
Бібліотечний
Пошукові машини.
Пошукові машини являють собою вузли Web, на яких для полегшення пошуку знаходяться алфавітні покажчики майже всіх слів, що розміщуються на всіх існуючих сторінках Web. Деякі пошукові машини призначені для роботи з групами новин Usenet. Заслуговують на увагу двоє вузлів, за допомогою яких виконується пошук серед груп новин:
Dejanews - http://www.dejanews.com
SIFT - http://sift.stanford.edu
Деякі пошукові машини розміщують дані про сторінки Web, що створені заново. Уже за кілька годин після виникнення Web-сторінки інформація про неї може бути в пошуковій машині.
Нижче в Таблиці 2 наведено перелік пошукових машин, що спеціалізуються на наданні інформації про недавно створені вузли Web.
Таблиця 2. Інформація про нещодавно створені вузли
№ Назва Адреса
1. What's New Too http://www.manifest.com
2. What's New On Yahoo http://www.yahoo.com
3. Starting Point http://www.stpt.com
4. New Happenings http://www.midinet.net
Пошук адреси електронної пошти.
Існують пошукові машини, призначені для того, щоб знаходити адреси електронної пошти.
Fourll - база даних, що вміщує більш ніж 3 мільйони адрес електронної пошти: http://www.fourll.com
LookUp - база даних (менших за розміром), вміщує адреси електронної пошти: http://www.lookup.com
Пошук за допомогою метапошукових машин.
Метапошукова машина являє собою вузол, за допомогою якого в системі Web здійснюється пошук визначеної, деталізованої інформації. Метапошукова машина дозволяє при введенні критерію пошуку лише раз, одночасно опитувати велику кількість баз даних, представляючи результати в організованій, релевантній формі. На жаль, більшість з існуючих на даний час метапошукових машин не функціонують таким чином. Більшість з них здійснюють пошук у декількох базах даних, але не одночасно, а послідовно звертаючись до них.
Найкращою метапошуковою машиною є система Sawy Search, яка може звертатися одночасно до 5 баз даних. Перед видачею результатів ця система вилучає інформацію, що дублюється.
В таблиці 3 наведені найбільш популярні метапошукові машини з їх адресами:
Таблиця 3. Метапошукові машини
№ Назва Адреса
1. All-In-One http://www.albany/net/allinau
2. Internet Heuth http://www.intbc.соm/sleuth/sleuth/html
3. Metasearch http://www.metasearch.com
4. Sawy Search http://cage.cs.colostate.edu
5. Web-Search http://www.biddeford.com/soaring
6. W3 Catalog http://cuiwww.unige.ch/w3catalog
Програмні агенти.
Незважаючи на велику кількість пошукових та метапошукових машин, розробники програмного забезпечення створили пошук за допомогою програмних агентів. Такі агенти являють собою інтелектуальне програмне забезпечення, яке може відслідковувати найбільш важливі вузли. Агенти переходять від одного вузла до іншого, відшуковуючи потрібні дані та визначають їх місцезнаходження. Таким чином зберігається час користувача, який би він витрачав на введення умов для пошуку, відвідуючи кожен вузол окремо. Агенти також зможуть відслідковувати зміну інформації на певних вузлах і повідомляти про це користувачу.
У таблиці 4 наведені найбільш уживані системи програмних агентів.
Таблиця 4. Програмні агенти
№ Назва Адреса Призначення
1. Web Compass http://www.quarterdeck.com Найбільший пошуковий агент
2. SqURL http://www.bluesguierrd.com Працює із системами Altavista, Exite, Lycos
3. Surfbot http://www.specter.com Забезпечує пошук у пошукових машинах за ключовими словами
Професійні служби.
Зараз усе більше фірм починають спеціалізуватися на наданні платних послуг, що пов'язані з пошуком інформації.
Фірма Dataquest (http://dataquest.com/weekly/main.html) спеціалізується в області комп'ютерної індустрії. Ця компанія видає оперативну газету Dataquest Interactive, основна частина якої є безкоштовною для споживачів. Але при звертанні до комерційної інформації потрібна оплата від US$95 до US$4000, залежно від обсягу та виду інформації (детальний аналіз ринку, тенденція його розвитку тощо.)
Для отримання свіжих новин, спортивної інформації, прогнозу погоди можна використовувати вузол Forecast (http://www.forcast.com). Служба Data Times (http://www.de.enews.com/chisters/datatimes) є також комерційною професійною інформаційною системою. Вона використовує у своїй базі даних повідомлення, взяті з місцевих, регіональних і міжнародних газет, журналів, теле- і радіопередач та інших джерел інформації. Але існують компанії, що надають інформаційні послуги цілком безкоштовно.
В таблиці 5 представлені такі вузли
Таблиця 5. Безкоштовні вузли.
№ Назва Адреса Призначення
1. National Public Radio http://www.npr.com Загальна інформація
2. СNN Interactive http://www.cnn.com Загальна інформація
3. Reuters New Media http://www.yahoo.com/headlines Загальна інформація
4. USA Today http://www.usatoday.com Газетна інформація
5. The New York Times http://nytemes.com Газетна інформація
6. Time http://www.pathfinder.com/time/ Журнальна інформація
7. The Washington Times Weekly Edition http://www.watchtimeweekly.com Журнальна інформація

Комментариев нет:

Отправить комментарий