Реферат на тему:
Гіпертекстові технології
WWW, URL, HTML
World Wide Web переводиться на російську мову як “Всесвітня Павутина”. І, по суті, це дійсно так. WWW є одним із самих зроблених інструментів для роботи в глобальній світовій мережі Internet. Ця служба з'явилася порівняно недавно й усе ще продовжує бурхливо розвиватися.
Найбільша кількість розробок мають відношення до батьківщини WWW - CERN, European Particle Physics Laboratory; але було би помилкою вважати, що Web є інструментом, розробленим фізиками і для фізиків. Плодотворність і привабливість ідей, покладених в основу проекту, перетворили WWW у систему світового масштабу, що надає інформацію навряд чи не у всіх областях людської діяльності й охоплюючи приблизно 30 млн. користувачів у 83 країнах світу.
Головна відмінність WWW від інших інструментів для роботи з Internet полягає в тім, що WWW дозволяє працювати практично з усіма доступними зараз на комп'ютері видами документів: це можуть бути текстові файли, ілюстрації, звукові і відео ролики, і т.д.
Що таке WWW? Це спроба організувати всю інформацію в Internet, плюс будь-яку локальну інформацію з вашого вибору, як набір гіпертекстових документів. Ви переміщаєтеся по мережі, переходячи від одного документа до іншого по посиланнях. Усі ці документи написані на спеціально розробленому для цього мові, що називається HyperText Markup Language (HTML). Він чимось нагадує мову, що використовується для написання текстових документів, тільки HTML простіше. Причому, можна використовувати не тільки інформацію, надану Internet, але і створювати власні документи. В останньому випадку існує ряд практичних рекомендацій до їх написання.
Уся користь гіпертексту складається в створенні гіпертекстових документів, якщо вас зацікавив який або пункт у такому документі, то вам досить тикнути туди курсором для одержання потрібної інформації. Також в одному документі можливо робити посилання на іншими, написаними іншими чи авторами навіть розташовані на іншому сервері. У той час як вам це представляється як одне ціле.
Гіпермедіа ця надбезліч гіпертексту. У гіпермедіа виробляються операції не тільки над текстом але і над звуком, зображеннями, анімацією.
Існують WWW-сервери для Unix, Macintosh, MS Windows і VMS, більшість з них поширюються вільно. Установивши WWW-сервер, ви можете вирішити двох задач:
1. Надати інформацію зовнішнім споживачам - зведення про вашу фірму, каталоги продуктів і послуг, технічну чи наукову інформацію.
2. Надати своїм співробітникам зручний доступ до внутрішніх інформаційних ресурсів організації. Це можуть бути останні розпорядження керівництва, внутрішній телефонний довідник, відповіді на питання, що часто задаються, для користувачів прикладних систем, технічна документація й усе, що підкаже фантазія адміністратора і користувачів. Інформація, що ви хочете надати користувачам WWW, оформляється у виді файлів мовою HTML. HTML - проста мова розмітки, що дозволяє позначати фрагменти тексту і задавати посилання на інші документи, виділяти заголовки декількох рівнів, розбивати текст на абзаци, центрувати їхній і т.п., перетворюючи простий текст в отформатований гіпермедійний документ. Досить легко створити html-файл вручну, однак, маються спеціалізовані редактори і перетворювачі файлів з інших форматів.
Для перегляду документів використовуються спеціальні програми, такі як Mosaic, Netscape, Internet Explorer, lynx, www і інші. Mosaic і Netscape зручно використовувати на графічних терміналах. Для роботи на символьних терміналах можна порекомендувати lynx.
Архітектура WWW-технології
Від опису основних компонентів перейдемо до архітектури взаємодії програмного забезпечення в системі World Wide Web. WWW побудована за добре відомою схемою “клієнт-сервер”. На схемі 1 показано, як розділені функції в цій схемі. Програма-клієнт виконує функції інтерфейсу користувача і забезпечує доступ практично до всіх інформаційних ресурсів Internet. У цьому змісті вона виходить за звичайні рамки роботи клієнта тільки із сервером визначеного протоколу, як це відбувається в telnet, наприклад. Почасти, досить широко поширена думка, що Mosaic чи Netscape, що є WWW-клієнтами, це просто графічний інтерфейс у Internet, є почасти вірним. Однак, як уже було відзначено, базові компоненти WWW-технології (HTML і URL) грають при доступі до інших ресурсів Mosaic не останню роль, і тому мультипротокольні клієнти повинні бути віднесені саме до World Wide Web, а не до інших інформаційних технологій Internet. Фактично, клієнт-це інтерпретатор HTML. І як типовий інтерпретатор, клієнт у залежності від команд (розмітки) виконує різні функції.
Схема 1.
Схема 1. Структура ”клієнт - сервер” .
У круг цих функцій входить не тільки розміщення тексту на екрані, але обмін інформацією із сервером у міру аналізу отриманого HTML-тексту, що найбільше наочно відбувається при відображенні убудованих у текст графічних образів. При аналізі чи URL-специфікації по командах сервера клієнт запускає додаткові зовнішні програми для роботи з документами у форматах, відмінних від HTML, наприклад GIF, JPEG, MPEG, Postscript і т.п. Узагалі говорячи для запуску клієнтом програм незалежно від типу документа була розроблена програма Luncher, але останнім часом набагато більше поширення одержав механізм узгодження програм, що запускаються, через MIME-типи. Іншу частину програмного комплексу WWW складає сервер протоколу HTTP, бази даних документів у форматі HTML, керовані сервером, і програмне забезпечення, розроблене в стандарті специфікації CGI. До самого останнього часу (до утворення Netscape) реально використовувалося два HTTP-сервери: сервер CERN і сервер NCSA. Але в даний час число базових серверів розширилося. З'явився дуже непоганий сервер для MS-Windows і Apachie-сервер для Unix-платформ. Існують і інші, але два останніх можна виділити з розумінь приступності використання. Сервер для Windows - це shareware, але без убудованого самоліквідатора, як у Netscape. З огляду на поширеність персоналок у нашій країні, таке програмне забезпечення дає можливість спробувати, що таке WWW. Другий сервер - це відповідь на погрозу комерціалізації. Netscape уже не поширює свій сервер Netsite вільно і пройшов слух, що NCSA-сервер також буде поширюватися на комерційній основі. У результаті був розроблений Apachie, що за словами його авторів буде freeware, і реалізує нові доповнення до протоколу HTTP, зв'язані з захистом від несанкціонованого доступу, що запропоновані групою по розробці цього протоколу і реалізуються практично у всіх комерційних серверах.
База даних HTML-документ-це частина файлової системи, що містить текстові файли у форматі HTML і зв'язані з ними графіку й інші ресурси. Особлива увага хотілася б звернути на документи, що містять елементи екранних форм. Ці документи реально забезпечують доступ до зовнішнього програмного забезпечення.
Прикладне програмне забезпечення, що працює із сервером, можна розділити на програми-шлюзи та інші. Це програми, що забезпечують взаємодію сервера із серверами інших протоколів, наприклад ftp, чи з розподіленими на мережі серверами Oracle. Інші програм-це програми, що приймають дані від сервера і виконують які-небудь дії: одержання поточної дати, реалізацію графічних посилань, доступ до локальних баз даних чи просто розрахунки.
Завершуючи обговорення архітектури World Wide Web хотілося б ще раз підкреслити, що її компоненти існують практично для всіх типів комп'ютерних платформ і вільно доступні в мереж
Основні компоненти технології World Wide Web
ДО 1989 року гіпертекст представляв нову, багатообіцяючу технологію, що мала відносно велике число реалізацій з одного боку, а з іншої сторони робилися спроби побудувати формальні моделі гіпертекстових систем, що носили скоріше описовий характер і були навіяні успіхом реляційного підходу опису даних. Ідея Т. Бернерс-Ли полягала в тім, щоб застосувати гіпертекстову модель до інформаційних ресурсів, розподіленим у мережі, і зробити це максимально простим способом. Він заклав три наріжних камені системи з чотирьох існуючих нині, розробивши:
мова гіпертекстової розмітки документів HTML (HyperText Markup Lan-guage); універсальний спосіб адресації ресурсів у мережі URL (Universal Resource Locator); протокол обміну гіпертекстовою інформацією HTTP (HyperText Transfer Protocol).
Пізніше команда NCSA додала до цим трьох компонентам четвертий: універсальний інтерфейс шлюзів CGI (Common Gateway Interface). Ідея HTМL-приклад надзвичайно вдалого рішення проблеми побудови гіпертекстової системи за допомогою спеціального засобу керування відображенням. На розробку мови гіпертекстової розмітки істотний вплив зробили два фактори: дослідження в області інтерфейсів гіпертекстових систем і бажання забезпечити простий і швидкий спосіб створення гіпертекстової бази даних, розподіленої на мережі.
У 1989 році активно обговорювалася проблема інтерфейсу гіпертекстових систем, тобто способів відображення гіпертекстової інформації і навігації в гіпертекстовій мережі. Значення гіпертекстової технології порівнювали зі значенням друкарства. Затверджувалося, що лист папера і комп'ютерні засоби відображення/відтворення серйозно відрізняються друг від друга, і тому форма представлення інформації теж повинна відрізнятися. Найбільш ефективною формою організації гіпертексту були визнані контекстні гіпертекстові посилання, а крім того був визнаний розподіл на посилання, асоційовані з усім документом у цілому й окремих його частинах.
Найпростішим способом створення будь-якого документа є його набивання в текстовому редакторі. Досвід створення добре розмічених для наступного відображення документів у CERN був - важко знайти фізика, що не користався би системою Te чи LaTe. Крім того на той час існував стандарт мови размітки-Stаndаrd Generalised Markup Language (SGML).
Варто також узяти до уваги, що відповідно до своїх пропозицій Бернерс-Ли припускав об'єднати в єдину систему наявні інформаційні ресурси CERN, і першими демонстраційними системами повинні були стати системи для NeXT і VAX/VMS.
Звичайно гіпертекстові системи мають спеціальні програмні засоби побудови гіпертекстових зв'язків. Самі гіпертекстові посилання зберігаються в спеціальних чи форматах навіть складають спеціальні файли. Такий підхід гарний для локальної системи, але не для розподіленої на безлічі різних комп'ютерних платформ. У HTML гіпертекстові посилання убудовані в тіло документа і зберігаються як його частину. Часто в системах застосовують спеціальні формати збереження даних для підвищення ефективності доступу. У WWW документ-це звичайні ASCII- файли, які можна підготувати в будь-якому текстовому редакторі. Таким чином, проблема створення гіпертекстової бази даних була вирішена надзвичайно просто.
Як базу для розробки мови гіпертекстової розмітки був обраний SGML (Standard Generalised Markup Language). Випливаючи академічним традиціям, Бернерс-Ли описав HTML у термінах SGML (як описують мова програмування в термінах форми Бекуса-Наура). Природно, що в HTML були реалізовані всі розмітки, зв'язані з виділенням параграфів, шрифтів, стилів і т.п., тому що реалізація для NeXT мала на увазі графічний інтерфейс. Важливим компонентом мови став опис убудованих і асоційованих гіпертекстових посилань, убудованої графіки і забезпечення можливості пошуку по ключових словах.
З моменту розробки першої версії мови (HTML 1.0) пройшло вже п'ять років. За цей час відбувся досить серйозний розвиток мови. Майже вдвічі збільшилося число елементів розмітки, оформлення документів усе більше наближається до оформлення якісних друкованих видань, розвиваються засоби опису не текстових інформаційних ресурсів і способи взаємодії з прикладним програмним забезпеченням. Удосконалюється механізм розробки типових стилів. Фактично, у даний час HTML розвивається убік створення стандартної мови розробки інтерфейсів як локальних, так і розподілених систем.
Другим наріжним каменем WWW стала універсальна форма адресації інформаційних ресурсів. Universal Resource Identification (URI) являє собою досить струнку систему, що враховує досвід адресації й ідентифікації e-mail, Gopher, WAIS, telnet, ftp і т.п. Але реально з усього, що описано в URI, для організації баз даних у WWW потрібно тільки Universal Resource Locator (URL). Без наявності цієї специфікації вся міць HTML виявилася б марною. URL використовується в гіпертекстових посиланнях і забезпечує доступ до розподілених ресурсів мережі. У URL можна адресувати як інші гіпертекстові документи формату HTML, так і ресурси e-mail, telnet, ftp, Gopher, WAIS, наприклад. Різні інтерфейсні програми по різному здійснюють доступ до цих ресурсів. Одні, як наприклад Netscape, самі здатні підтримувати взаємодія по протоколах, відмінним від протоколу HTTP, базового для WWW, інші, як наприклад Chimera, викликають для цієї мети зовнішні програми. Однак, навіть у першому випадку, базовою формою представлення відображуваної інформації є HTML, а посилання на інші ресурси мають форму URL. Слід зазначити, що програми обробки електронної пошти у форматі MIME також мають можливість відображати документи, представлені у форматі HTML. Для цієї мети в MIME зарезервований тип “text/html”.
Третім у нашому списку коштує протокол обміну даними в World Wide Web -HyperText Transfer Protocol. Даний протокол призначений для обміну гіпертекстовими документами і враховує специфіку такого обміну. Так у процесі взаємодії, клієнт може одержати нову адресу ресурсу на мережі (relocation), запросити убудовану графіку, прийняти і передати параметри і т. п. Керування в HTTP реалізовано у виді ASCII-команд. Реально розроблювач гіпертекстової бази даних зіштовхується з елементами протоколу тільки при використанні зовнішніх розрахункових чи програм при доступі до зовнішнім відносно WWW інформаційним ресурсам, наприклад базам даних.
Остання складова технології WWW - це вже плід роботи групи NCSA -- специфікація Common Gateway Interface. CGI була спеціально розроблена для розширення можливостей WWW за рахунок підключення всілякого зовнішнього програмного забезпечення. Такий підхід логічно продовжував принцип публічності і простоти розробки і нарощування можливостей WWW. Якщо команда CERN запропонувала простий і швидкий спосіб розробки баз даних, то NCSA розвила цей принцип на розробку програмних засобів. Треба помітити, що в загальнодоступній бібліотеці CERN були модулі, що дозволяють програмістам підключати свої програми до сервера HTTP, але це вимагало використання цієї бібліотеки. Запропонований і описаний у CGI спосіб підключення не вимагав додаткових бібліотек і буквально приголомшував своєю простотою. Сервер взаємодіяв із програмами через стандартні потоки введення/висновку, що спрощує програмування до межі. При реалізації CGI надзвичайно важливе місце зайняли методи доступу, описані в HTTP. І хоча реально використовуються тільки два з них (GET і POST), досвід розвитку HTML показує, що співтовариство WWW чекає розвитку і CGI у міру ускладнення задач, у яких буде використовуватися WWW-технологія.