Головна Головна -> Реферати українською -> Інформатика, комп'ютери, програмування -> Проблеми використання роботів в Інтернеті

Проблеми використання роботів в Інтернеті

Назва:
Проблеми використання роботів в Інтернеті
Тип:
Реферат
Мова:
Українська
Розмiр:
14,15 KB
Завантажень:
23
Оцінка:
 
поточна оцінка 5.0


Скачати цю роботу безкоштовно
Пролистати роботу: 1  2  3  4 
Вступ 3

Використання роботів 3

Статистичний аналіз 4

Підтримка 4

Дзеркала 5

Пошук ресурсів 6

Комбіноване використання 7

Ціна використання та застереження 7

Ресурси мережі та завантаження серверів 7

Оновлення 8

Погані реалізації 10

Ведення каталогу 11

Забагато матеріалу, що є забагато динамічним. 11

Визначення що індексувати, а що ні. 11

Статистичний аналіз 13

Етика 13

Альтернативи для пошуку ресурсів 15

Висновок 16

Література 18

Вступ

Всесвітня павутина стала дуже популярною за останні декілька років, і є зараз основним засобом розміщення інформації в інтернет. Коли розмір WWW збільшився від декількох десятків сайтів, стало зрозуміло, що людина не в змозі самостійно переглянути таку кількість сайтів, тим паче знайти нові.

Тому почалися розробки програм, що автоматично переглядають WWW. Така програма-робот передивляється Інтернет сторінка за сторінкою, йдучи за посиланнями на інші сторінки. Роботів також називають павуками (spiders) або черв‘яками (worms), але ці назви дають хибне враження, що роботи пересуваються самі, або, що вони копіюють себе, як відомі інтернет-черви. Насправді, робот – це одна програмна система, що отримує інформацію з Інтернет сайтів використовуючи стандартні протоколи WWW.

Використання роботів

Переглядаючи Інтернет, роботи можуть виконувати такі функції:

Статистичний аналіз

Найперші роботи були створені для підрахунку кількості WWW-серверів. Сучасні роботи можуть також підраховувати іншу статистичну інформацію, як то, середню кількість документів на один сервер, пропорцію заданих типів файлів, середній розмір веб-сайту, ступень міжсполучення між сайтами.

Підтримка

Одна з основних проблем підтримки Інтернет виникає, коли перестають працювати посилання на інші сторінки. Це відбувається тоді, коли сторінка, на яку посилаються, перемістилася на іншу адресу або взагалі перестала існувати. Нажаль, натепер не існує автоматичного механізму, що повідомляв би веб-мастерів про такі зміни.

Деякі сервери, наприклад CERN HTTPD, записують у файл журналу, запити до сторінки, що не існує, з адресою сторінки, звідки йшло посилання, що дозволяє виправити ситуацію пізніше. Але це не практично, і, насправді, автори дізнаються, про неправильні посилання на своїх сторінках, коли помітять самі, або коли користувачі повідомлять їх по пошті.

Робот, що перевіряє посилання, такий як MOMspider, допомагає автору знайти такі неправильні посилання, тому допомагає підтримувати сайт. Роботи можуть допомагати підтримувати зміст так само, як і структуру, первіряючи правильність HTML коду, регулярність оновлення інформації, але це використовується не дуже часто. Цей вид функціональності часто є вбудованою частиною HTML редакторів, але, роботи можуть повторювати ці перевірки при кожній модифікації сайту, і будь-які проблеми можуть бути вирішені негайно.

Дзеркала

Дзеркальність – популярна техніка для підтримки FTP архівів. Дзеркало містить копію усього дерева каталогів FTP сайту і регулярно оновлює ті документи, що додаються до оригінального сайту. Це дозволяє зменшити трафік до кожного з вузлів, їх завантаженість, працювати з архівом, якщо оригінальний сервер не працює, мати швидкий та дешевий локальний доступ та доступ без підключення до інтернет.

Дзеркальність може бути легко забезпечена роботом. Вже існують роботи, що отримують дерево каталогів веб-вузлу та записують його локально, але вони не мають можливості оновлювати тільки ту інформацію, що змінилася. Необхідність таких засобів зменшилася з появою складних кеш-серверів, які можуть робити вибіркове оновлення, та гарантувати, що документ з кешу є оновленим.

Пошук ресурсів

Мабуть, найбільш захоплюючим використанням роботів є пошук нових ресурсів. Там, де люди не можуть впоратись з величезною кількістю інформації, комп‘ютер зробить цю задачу швидко й якісно. Існує багато роботів, що оглядають великі частини WWW та дають доступ до зібраної інформації за допомогою пошукової системи.

Це значить, що користувач може одночасно використовувати перегляд та пошук для знаходження потрібної інформації. Навіть, якщо база даних не містить саме ту інформацію, що вам потрібна, ймовірно вона містить сторінки на яких є посилання на потрібну.

Другою перевагою є те, що ці бази даних можуть оновлюватися періодично, і посилання на сторінки, що не існують, можуть бути знайдені та видалені. Це добра альтернатива ручній підтримці документів, де перевірки бувають рідкі та не глибокі.

Комбіноване використання

Один робот може виконувати декілька задач. Наприклад RBSE Spider робить статистичний аналіз отриманих документів та видає базу даних знайдених ресурсів.

Ціна використання та застереження

В цьому розділі ми побачимо, як роботи можуть завдавати шкоди, та як цю шкоду можна мінімізувати.

Ресурси мережі та завантаження серверів

Завантажити цю роботу безкоштовно
Пролистати роботу: 1  2  3  4 



Реферат на тему: Проблеми використання роботів в Інтернеті

BR.com.ua © 1999-2017 | Реклама на сайті | Умови використання | Зворотній зв'язок