Глобальная паутина интернет. Что такое всемирная паутина кратко. История Всемирной паутины. Велико ли различие

Говоря об Интернете, часто имеют в виду именно Всемирную паутину. Однако важно понимать, что это не одно и то же.

Структура и принципы

Всемирную паутину образуют миллионы веб-серверов сети Интернет , расположенных по всему миру. Веб-сервер - это компьютерная программа , запускаемая на подключённом к сети компьютере и использующая протокол HTTP для передачи данных. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны в ответ на HTTP-запрос динамически генерировать документы с помощью шаблонов и сценариев .

Для просмотра информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа - веб-браузер . Основная функция веб-браузера - отображение гипертекста . Всемирная паутина неразрывно связана с понятиями гипертекста и гиперссылки . Большая часть информации в Вебе представляет собой именно гипертекст.

Для создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык HTML (англ. HyperText Markup Language «язык разметки гипертекста»). Работа по созданию (разметке) гипертекстовых документов называется вёрсткой , она делается веб-мастером либо отдельным специалистом по разметке - верстальщиком. После HTML-разметки получившийся документ сохраняется в файл , и такие HTML -файлы являются основным типом ресурсов Всемирной паутины. После того, как HTML-файл становится доступен веб-серверу, его начинают называть «веб-страницей». Набор веб-страниц образует веб-сайт .

Гипертекст веб-страниц содержит гиперссылки. Гиперссылки помогают пользователям Всемирной паутины легко перемещаться между ресурсами (файлами) вне зависимости от того, находятся ресурсы на локальном компьютере или на удалённом сервере. Для определения местонахождения ресурсов во Всемирной паутине используются единообразные локаторы ресурсов URL (англ. Uniform Resource Locator ). Например, полный URL главной страницы русского раздела Википедии выглядит так: http://ru.wikipedia.org/wiki/Заглавная_страница. Подобные URL-локаторы сочетают в себе технологию идентификации URI (англ. Uniform Resource Identifier «единообразный идентификатор ресурса») и систему доменных имён DNS (англ. Domain Name System ). Доменное имя (в данном случае ru.wikipedia.org) в составе URL обозначает компьютер (точнее - один из его сетевых интерфейсов), который исполняет код нужного веб-сервера. URL текущей страницы обычно можно увидеть в адресной строке браузера, хотя многие современные браузеры предпочитают по умолчанию показывать лишь доменное имя текущего сайта.

Технологии

Для улучшения визуального восприятия веба стала широко использоваться технология CSS , которая позволяет задавать единые стили оформления для множества веб-страниц. Ещё одно нововведение, на которое стоит обратить внимание, - система обозначения ресурсов URN (англ. Uniform Resource Name ).

Популярная концепция развития Всемирной паутины - создание семантической паутины . Семантическая паутина - это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров. Семантическая паутина - это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру. Семантическая паутина открывает доступ к чётко структурированной информации для любых приложений, независимо от платформы и независимо от языков программирования . Программы смогут сами находить нужные ресурсы, обрабатывать информацию, классифицировать данные, выявлять логические связи, делать выводы и даже принимать решения на основе этих выводов. При широком распространении и грамотном внедрении семантическая паутина может вызвать революцию в Интернете. Для создания понятного компьютеру описания ресурса, в семантической паутине используется формат RDF (англ. Resource Description Framework ), который основан на синтаксисе XML и использует идентификаторы URI для обозначения ресурсов. Новинки в этой области - это RDFS (англ. RDF Schema ) и SPARQL (англ. Protocol And RDF Query Language ) (произносится как «спа́ркл»), новый язык запросов для быстрого доступа к данным RDF.

История

Основная статья: История Всемирной паутины

Изобретателями всемирной паутины считаются Тим Бернерс-Ли и, в меньшей степени, Роберт Кайо . Тим Бернерс-Ли является автором технологий HTTP , URI /URL и HTML . В 1980 году он работал в Европейском совете по ядерным исследованиям (фр. conseil européen pour la recherche nucléaire , CERN ) консультантом по программному обеспечению. Именно там, в Женеве (Швейцария), он для собственных нужд написал программу «Энквайр» (англ. Enquire , можно вольно перевести как «Дознаватель»), которая использовала случайные ассоциации для хранения данных и заложила концептуальную основу для Всемирной паутины.

В рамках проекта Бернерс-Ли написал первый в мире веб-сервер , называвшийся «httpd », и первый в мире гипертекстовый веб-браузер , называвшийся «WorldWideWeb». Этот браузер был одновременно и WYSIWYG -редактором (сокр. от англ. what you see is what you get - что видишь, то и получишь), его разработка была начата в октябре 1990 года , а закончена в декабре того же года. Программа работала в среде NeXTStep и начала распространяться по Интернету летом 1991 года .

Майк Сендал (Mike Sendall) покупает в это время компьютер «NeXT cube» для того, чтобы понять, в чём состоят особенности его архитектуры, и отдаёт его затем Тиму [Бернерс-Ли]. Благодаря совершенству программной системы «NeXT cube» Тим написал прототип, иллюстрирующий основные положения проекта, за несколько месяцев. Это был впечатляющий результат: прототип предлагал пользователям, кроме прочего, такие развитые возможности, как WYSIWYG browsing/authoring!… В течение одной из сессий совместных обсуждений проекта в кафетерии ЦЕРНа мы с Тимом попытались подобрать «цепляющее» название (catching name) для создаваемой системы. Единственное, на чём я настаивал, это чтобы название не было в очередной раз извлечено всё из той же греческой мифологии. Тим предложил «world wide web». Всё в этом названии мне сразу очень понравилось, только трудно произносится по-французски.

Первый в мире веб-сайт был размещён Бернерсом-Ли 6 августа 1991 года на первом веб-сервере , доступном по адресу http://info.cern.ch/ , (). Ресурс определял понятие «Всемирной паутины », содержал инструкции по установке веб-сервера, использования браузера и т. п. Этот сайт также являлся первым в мире интернет-каталогом , потому что позже Тим Бернерс-Ли разместил и поддерживал там список ссылок на другие сайты.

На первой фотографии, появившейся во Всемирной паутине, была изображена пародийная филк -группа Les Horribles Cernettes . Тим Бернерс-Ли попросил у лидера группы отсканированные фотографии после музыкального фестиваля «CERN hardronic festival».

И всё же теоретические основы веба были заложены гораздо раньше Бернерса-Ли. Ещё в 1945 году Ванна́вер Буш разработал концепцию Memex - вспомогательных механических средств «расширения человеческой памяти ». Memex - это устройство, в котором человек хранит все свои книги и записи (а в идеале - и все свои знания, поддающиеся формальному описанию) и которое выдаёт нужную информацию с достаточной скоростью и гибкостью. Оно является расширением и дополнением памяти человека. Бушем было также предсказано всеобъемлющее индексирование текстов и мультимедийных ресурсов с возможностью быстрого поиска необходимой информации. Следующим значительным шагом на пути ко Всемирной паутине было создание гипертекста (термин введён Тедом Нельсоном в 1965 году).

С 1994 года основную работу по развитию Всемирной паутины взял на себя консорциум Всемирной паутины (англ. world wide web consortium , в сокращённой записи W3C ), основанный и до сих пор возглавляемый Тимом Бернерсом-Ли. Данный консорциум - организация, разрабатывающая и внедряющая технологические стандарты для Интернета и Всемирной паутины. Миссия W3C: «Полностью раскрыть потенциал Всемирной паутины путём создания протоколов и принципов, гарантирующих долгосрочное развитие Сети». Две другие важнейшие задачи консорциума - обеспечить полную «интернационализа́цию Сети́» и сделать Сеть доступной для людей с ограниченными возможностями.

W3C разрабатывает для Интернета единые принципы и стандарты (называемые «рекомендациями», англ. W3C recommendations ), которые затем внедряются производителями программ и оборудования. Таким образом достигается совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной. Все рекомендации консорциума Всемирной паутины открыты, то есть не защищены патентами и могут внедряться любым человеком без всяких финансовых отчислений консорциуму.

Перспективы развития

В настоящее время наметились два направления в развитии Всемирной паутины: семантическая паутина и социальная паутина .

  • Семантическая паутина предполагает улучшение связности и релевантности информации во Всемирной паутине через введение новых форматов метаданных .
  • Социальная паутина полагается на пользователей, выполняющих упорядочивание имеющейся в сети информации.

В рамках второго направления наработки, являющиеся частью семантической паутины, активно используются в качестве инструментов (RSS и другие форматы веб-каналы , OPML , микроформаты XHTML). Частично семантизированные участки дерева категорий «Википедии» помогают пользователям осознанно перемещаться в информационном пространстве, однако, очень мягкие требования к подкатегориям не дают основания надеяться на расширение таких участков. В связи с этим интерес могут представлять попытки составления атласов Знания.

Существует также популярное понятие Web 2.0 , обобщающее сразу несколько направлений развития Всемирной паутины.

Способы активного отображения информации

Представленная в сети информация может быть доступна:

  • только для чтения («пассивно»);
  • для чтения и добавления/изменения («активно»).

К способам активного отображения информации во Всемирной паутине относятся:

Это деление весьма условно. Так, скажем, блог или гостевую книгу можно рассматривать как частный случай форума, который, в свою очередь, является частным случаем системы управления контентом. Обычно разница проявляется в назначении, подходе и позиционировании того или иного продукта.

Отчасти информация с сайтов может также быть доступна через речь. В Индии уже началось тестирование системы, делающей текстовое содержимое страниц доступным даже для людей, не умеющих читать и писать.

Безопасность

Распространение

В период с 2005 по 2010 год количество веб-пользователей удвоилось и достигло отметки двух миллиардов . Согласно ранним исследованиям и 1999 годов , большинство существующих веб-сайтов не индексировалось корректно поисковыми системами, а сама веб-сеть оказалась крупнее, чем ожидалось . По данным на 2001 год было создано уже более 550 миллионов веб-документов, большинство из которых, однако, находилось в пределах невидимой сети . По данным на 2002 год было создано более 2 миллиардов веб-страниц , 56,4 % всего интернет-содержимого было на английском языке , после него шёл немецкий (7,7 %), французский (5,6 %) и японский (4,9 %). Согласно исследованиям, проводимым в конце января 2005 года , на 75 разных языках было определено более 11,5 миллиарда веб-страниц, которые были индексированы в открытой сети . А по данным на март 2009 года , количество страниц увеличилось до 25,21 миллиарда . 25 июля 2008 года инженеры программного обеспечения Google Джессе Альперт и Ниссан Хайай объявили, что поисковик Google засёк более миллиарда уникальных URL -ссылок .

Памятник

См. также

Примечания

  1. «Web как „следующий шаг“ (NextStep) революции персональных компьютеров».
  2. LHC: The first band on the web
  3. IBM разработала голосовой интернет
  4. Ben-Itzhak, Yuval . Infosecurity 2008 – New defence strategy in battle against e-crime , ComputerWeekly , Reed Business Information (18 April 2008). Проверено 20 апреля 2008.
  5. Christey, Steve and Martin, Robert A. Vulnerability Type Distributions in CVE (version 1.1) (неопр.) . MITRE Corporation (22 May 2007). Проверено 7 июня 2008. Архивировано 15 апреля 2013 года.
  6. “Symantec Internet Security Threat Report: Trends for July–December 2007 (Executive Summary)” (PDF) . XIII . Symantec Corp. April 2008: 1-2. Проверено 11 May 2008 .
  7. Google searches web"s dark side , BBC News (11 May 2007). Проверено 26 апреля 2008.
  8. Security Threat Report (неопр.) (PDF). Sophos (Q1 2008). Проверено 24 апреля 2008. Архивировано 15 апреля 2013 года.
  9. Security threat report (неопр.) (PDF). Sophos (July 2008). Проверено 24 августа 2008. Архивировано 15 апреля 2013 года.
  10. Fogie, Seth, Jeremiah Grossman, Robert Hansen, and Anton Rager. Cross Site Scripting Attacks: XSS Exploits and Defense . - Syngress, Elsevier Science & Technology, 2007. - P. 68–69, 127. - ISBN 1-59749-154-3 .
  11. O"Reilly, Tim. What Is Web 2.0 (неопр.) 4–5. O"Reilly Media (30 September 2005). Проверено 4 июня 2008. Архивировано 15 апреля 2013 года.
  12. Ritchie, Paul (March 2007). “The security risks of AJAX/web 2.0 applications” (PDF) . Infosecurity . Elsevier. Архивировано из оригинала (PDF) 2008-06-25. Проверено 6 June 2008 .
  13. Berinato, Scott . Software Vulnerability Disclosure: The Chilling Effect , CSO , CXO Media (1 January 2007), стр. 7. Архивировано 18 апреля 2008 года. Проверено 7 июня 2008.
  14. Prince, Brian . McAfee Governance, Risk and Compliance Business Unit , eWEEK , Ziff Davis Enterprise Holdings (9 April 2008). Проверено 25 апреля 2008.
  15. Preston, Rob . Down To Business: It"s Past Time To Elevate The Infosec Conversation , InformationWeek , United Business Media (12 April 2008). Проверено 25 апреля 2008.
  16. Claburn, Thomas . RSA"s Coviello Predicts Security Consolidation , InformationWeek , United Business Media (6 February 2007). Проверено 25 апреля 2008.
  17. boyd, danah; Hargittai, Eszter (July 2010). “Facebook privacy settings: Who cares?” . First Monday . University of Illinois at Chicago. 15 (8). Используется устаревший параметр |month= (справка)
  18. Lynn, Jonathan . Internet users to exceed 2 billion … , Reuters (19 October 2010). Проверено 9 февраля 2011.
  19. S. Lawrence, C.L. Giles, "Searching the World Wide Web, " Science, 280(5360), 98-100, 1998.
  20. S. Lawrence, C.L. Giles, "Accessibility of Information on the Web, " Nature, 400, 107-109, 1999.
  21. (неопр.) . Brightplanet.com. Проверено 27 июля 2009.

Всемирная паутина (англ. World Wide Web) - глобальное информационное пространство, основанное на физической инфраструктуре Интернета и протоколе передачи данных HTTP. Всемирная паутина вызвала настоящую революцию в информационных технологиях и бум в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину. Для обозначения Всемирной паутины также используют слово веб (англ. web) и аббревиатуру «WWW».

Всемирную паутину образуют миллионы веб-серверов сети Интернет, расположенные по всему миру. Веб-сервер - программа, запускаемая на подключённом к сети компьютере. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны динамически формировать ресурсы в ответ на HTTP-запрос.

Для просмотра информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа-клиент - веб-бра́узер (web-browser) . Основная функция веб-браузера - отображение гипертекста .

Всемирная паутина неразрывно связана с понятиями гипертекста. Гипертекст (Hypertext) – это документ или система документов с перекрестными ссылками (гиперссылками ). По такому документу можно перемещаться не последовательно, а, активируя гиперссылки, переходить по ним к связанным со ссылками текстам или файлам.

Для создания, хранения и отображения гипертекста используется язык HTML (англ. HyperText Markup Language) , язык разметки гипертекста. Работа по разметке гипертекста называется вёрсткой, специалисты по разметке называются веб-мастерами .

HTML-файл является самым распространённым ресурсом Всемирной паутины. HTML-файл доступный веб-серверу, называют «веб-страницей ». Набор связанных тематикой, дизайном или владельцем веб-страниц образует веб-сайт .

Информация в вебе может отображаться как пассивно (то есть пользователь может только считывать её), так и активно - тогда пользователь может добавлять информацию и редактировать её. К способам активного отображения информации во Всемирной паутине относятся:

Гостевые книги,

Wiki-проекты,

Системы управления контентом.

HTML-разметка

HTML (HyperText Markup Language) не является языком программирования, он является языком форматирования, т.е. придания внешнего вида web-странице, при ее присмотре в браузере. Для разметки документа используются теги . Теги заключаются в угловые скобки, и, за редким исключением, являются парными, т.е. существует открывающий и закрывающий тег. Например, чтобы отметить начало нового абзаца в документе ставится тег

(от paragraph ). Тогда в конце абзаца обязательно должен ставиться закрывающий тег

.


При расстановке тегов соблюдается правило: закрываются теги в порядке обратном их появлению. Например, если слово в тексте должно быть выделено жирностью (тег от bold ) и одновременно курсивом (тег от italic ), то это может быть сделано одним из следующих способов: слово , или слово.

Ниже приводится текст некоторого html-документа и результат его отображения в браузере:

Доброе время суток, уважаемый посетитель!

Надеюсь, вы попали как раз туда, куда хотели.

Здесь вы найдете стихи , песни и сценарии для организации любых праздников.

А теперь специальный подарок к 1 сентябряb>

Он к "пятерочкам" привык -

Русский пять и пение.

Мне всегда его дневник

Портит настроение.

Научно-технический прогресс не стоит на месте, а пребывает в постоянном развитии, поиске, совершенствовании. Пожалуй, самое полезное изобретение человеческого гения – Интернет, было придумано сравнительно не так давно, по меркам развития цивилизации. По своей сути он представляет собой уникальный инструмент обмена данными.

Интернет (Сеть, Internet) — виртуальная среда, гарантирующая доступ к информационным ресурсам, элементами которой выступают персональные компьютеры. Они объединены в единую схему и наделены неповторимыми признаками адресации, использующие высокоскоростные линии связи с главными компьютерами.

Интернет – это огромная сеть, объединяющая бесчисленное количество устройств. Она служит для обмена информацией, которая существует в этой сети в различных формах. В наше время уже не только компьютеры могут подключаться к интернету. Мобильные телефоны, планшеты, игровые консоли, прочие гаджеты и даже телевизоры могут без труда выходить в сеть в любой момент.

Значимость данного информационного пространства бесспорна и по причине потрясающих возможностей коммуникации, между пользователями всех устройств, подключенных к Сети.

В техническом плане, онлайн пространство сформировано за счет бесчисленного множества компьютерных устройств соединенных друг с другом. Миллиарды пользователей ПК, проживающие в разных странах, ежедневно общаются между собой, передают и принимают полезную информацию, скачивают массивы цифровых данных в виде приложений, программ, утилит; смотрят видео, слушают музыку.

Онлайн среда обладает еще одним важным свойством – безграничными возможностями хранения информации. Через Internet передается личный опыт, кроме того, это – уникальная площадка информирования масс для современных СМИ и колоссальное хранилище мировых знаний.

Что представляет собой Интернет?

Для того, чтобы владельцы ПК, проживающие на разных континентах, могли свободно пользоваться услугами поиска сетевых ресурсов – на дне океана проложены магистральные кабели по которым круглосуточно перекачивается полезная информация.

Персональный компьютер управляется специальными протоколами. Это своеобразная инструкция, позволяющая устанавливать правила общения между устройствами. Единый критерий построения программного протокола – IP-адрес. Благодаря такой структуре любой участник получает собственный цифровой адрес, с помощью которого происходит поиск и идентификация.

К примеру, после ввода в строку браузера имени «novichkam.info» через считанные мгновения клиент оказывается на веб-площадке, предлагающей помощь новичкам. В техническом плане, программный робот просто находит код IP-адреса, который присвоен конкретному сайту.

Машинный алгоритм, включает следующие операции:

  1. запрос фиксируется главным сервером, где хранится имя нужного тематического массива данных;
  2. происходит нахождение в памяти имени данного ресурса, т.е. обнаружение необходимого IP-адреса;
  3. клиент попадает на web-сайт.

Существуют и другие протоколы, например HTTP. Запросы в иной способ осуществляются с добавлением префикса http://

Что такое всемирная паутина (WWW)

Для большинства представителей целевой аудитории большой интерес представляет определение сервиса Интернета в качестве Всемирной паутины (World Wide Web) в сокращении (WWW или просто WEB). Под ее определением понимается совокупность взаимосвязанных веб страниц, доступ к которым предоставляют ограниченное количество ПК, подключенных к Сети.

Набор текстовых файлов, размеченных на языке HTML с переходами по ссылкам, размещенный на электронной площадке, получил название web-сайта. Ознакомиться с контентом того или иного веб-сайта можно, активизировав работу браузера по поиску адресного имени.

Веб - сегодня позиционируется в качестве наиболее востребованного и популярного сервиса онлайн пространства, т.е. интернета. Важным элементом WEB выступают гипертекстовые ссылки. Кликнув на ссылку нужного документа или запросив в браузере уникальный URL (именной код, путь), человек может просматривать нужный массив текста.

Система адресации

При введении в поисковую строку неверного адресного имени или переходу по битой ссылке браузер оперативно просигнализирует об ошибке (подтвердит отсутствие нужной страницы). Нередко по запросу человек получает доступ к рекламному (мошенническому сайту).

В этой ситуации, следует исправить неточность в поле запросной строки, не пытаясь исследовать рекламный web-сайт из соображений безопасности. Дело в том, что данные площадки могут быть заражены вирусом. Если же ресурс создан с целью мошенничества, то нелишним будет ознакомиться с нашим разделом , где отлично расписаны самые популярные способы обмана в сети.

В адресе любого сайта главное – домен, который служит для простоты запоминания. Домен, как правило, отображает адрес главной страницы. Вместе с тем, следует понимать, что для технического скачивания страницы, компьютерное устройство использует IP с протоколом «12.123.45.5» . Согласитесь, эту комбинацию намного сложнее запомнить, чем доменное имя нашего сайта .

Важно знать, что ввод «http://» или префикса «WWW» в поисковой строке вовсе НЕ обязателен. Лучше воспользоваться услугами поисковой системы, где допущенная ошибка будет немедленно подкорректирована, а ввод домена возможен без зоны, вызывающей путаницу.

Что нам дает интернет?

  • неограниченного общения и коммуникации

Многие ищут здесь единомышленников, общаясь на популярных социальных проектах и форумах. Другим нравится уникальный сервис личного общения при помощи ICQ или Skype. Посетители website знакомств рассчитывают найти здесь свою вторую половину;

  • безграничные возможности развлечений и организации личного досуга

Здесь можно бесплатно слушать популярные музыкальные треки, наслаждаться новинками фильмографии киностудий, играть в различные игры, включая азартные, знакомиться с произведениями современных авторов и классиков литературного жанра, проходить опросы, тесты и т.д.

  • самообразование

В среде массовой коммуникации можно не только читать полезные статьи, но и участвовать в тренингах, мастер-классах, просматривать видео-уроки;

  • творческое развитие личности

Здесь можно повстречаться с редкими людьми, посещать их профессиональные проекты для творческого и личностного совершенствования;

  • покупка товаров и услуг

Клиенты виртуальных супермаркетов, могут купить товар, не выходя из дома. В режиме онлайн можно приобрести акции промышленных компаний, заказать билеты, забронировать номер гостиницы и пр.;

  • новые способы заработка

В Internet существует больше видов заработка. К примеру, можно открыть интернет-магазин, создав собственный блог (website). Тем, кто только пробует свои силы на этом поприще, проще начать с фриланса: писать статьи под заказ, продавать фото, предлагать услуги создания и продвижения разных проектов, заниматься веб-дизайном и программированием.

  • многое другое. Информация на нашем сайте поможет вам узнать не просто все возможности этой глобальной сети, но и отлично , находясь в ней.

Всемирная паутина (WWW)

Всеми́рная паути́на (англ. World Wide Web ) - распределённая система , предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету . Для обозначения Всемирной паутины также используют слово веб (англ. web «паутина») и аббревиатуру WWW . Всемирная паутина - крупнейшее всемирное многоязычное хранилище информации в электронном виде: десятки миллионов связанных между собой документов, которые расположены на компьютерах, расположенных по всему земному шару. Считается самой популярной и интересной службой сети Интернет, которая позволяет получать доступ к информации независимо от места её расположения. Чтобы узнать новости, научиться чему-нибудь или просто развлечься, люди смотрят телевизор, слушают радио, читают газеты, журналы, книги. Всемирная паутина тоже предлагает своим пользователям радиовещание, видеоинформацию, прессу, книги, но с той разницей, что всё это можно получить, не выходя из дома. Не важно, в каком виде представлена интересующая вас информация (текстовый документ, фотография, видеоролик или звуковой фрагмент) и где эта информация находится географически (в России, Австралии или на Берегу Слоновой Кости) - вы получите её в считанные минуты на свой компьютер.

Всемирную паутину образуют сотни миллионов веб-серверов . Большинство ресурсов Всемирной паутины представляет собой гипертекст . Гипертекстовые документы, размещаемые во всемирной паутине, называются веб-страницами . Несколько веб-страниц, объединённых общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же веб-сервере , называются веб-сайтом . Для загрузки и просмотра веб-страниц используются специальные программы - браузеры . Всемирная паутина вызвала настоящую революцию в информационных технологиях и бум в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину, однако важно понимать, что это не одно и то же.

История Всемирной паутины

Изобретателями всемирной паутины считаются Тим Бернерс-Ли и, в меньшей степени, Роберт Кайо . Тим Бернерс-Ли является автором технологий HTTP, URI/URL и HTML. В 1980 году он работал в Европейском совете по ядерным исследованиям (фр. Conseil Européen pour la Recherche Nucléaire, CERN) консультантом по программному обеспечению. Именно там, в Женеве (Швейцария), он для собственных нужд написал программу «Энквайр» (англ. Enquire, можно вольно перевести как «Дознаватель»), которая использовала случайные ассоциации для хранения данных и заложила концептуальную основу для Всемирной паутины.

В 1989 году, работая в CERN над внутренней сетью организации, Тим Бернерс-Ли предложил глобальный гипертекстовый проект, теперь известный как Всемирная паутина. Проект подразумевал публикацию гипертекстовых документов, связанных между собой гиперссылками , что облегчило бы поиск и консолидацию информации для учёных CERN. Для осуществления проекта Тимом Бернерсом-Ли (совместно с его помощниками) были изобретены идентификаторы URI, протокол HTTP и язык HTML. Это технологии, без которых уже нельзя себе представить современный Интернет. В период с 1991 по 1993 год Бернерс-Ли усовершенствовал технические спецификации этих стандартов и опубликовал их. Но, всё же, официально годом рождения Всемирной паутины нужно считать 1989 год.

В рамках проекта Бернерс-Ли написал первый в мире веб-сервер httpd и первый в мире гипертекстовый веб-браузер, называвшийся WorldWideWeb. Этот браузер был одновременно и WYSIWYG -редактором (сокр. от англ. What You See Is What You Get - что видишь, то и получишь), его разработка была начата в октябре 1990 года, а закончена в декабре того же года. Программа работала в среде NeXTStep и начала распространяться по Интернету летом 1991 года.

Первый в мире веб-сайт был размещён Бернерсом-Ли 6 августа 1991 года на первом веб-сервере , доступном по адресу http://info.cern.ch/ . Ресурс определял понятие Всемирной паутины, содержал инструкции по установке веб-сервера, использования браузера и т. п. Этот сайт также являлся первым в мире интернет-каталогом, потому что позже Тим Бернерс-Ли разместил и поддерживал там список ссылок на другие сайты.

С 1994 года основную работу по развитию Всемирной паутины взял на себя консорциум Всемирной паутины (англ. World Wide Web Consortium, W3C), основанный и до сих пор возглавляемый Тимом Бернерсом-Ли. Данный консорциум - организация, разрабатывающая и внедряющая технологические стандарты для Интернета и Всемирной паутины. Миссия W3C: «Полностью раскрыть потенциал Всемирной паутины путём создания протоколов и принципов, гарантирующих долгосрочное развитие Сети». Две другие важнейшие задачи консорциума - обеспечить полную «интернационализа́цию Сети́» и сделать Сеть доступной для людей с ограниченными возможностями.

W3C разрабатывает для Интернета единые принципы и стандарты (называемые «рекомендациями», англ. W3C Recommendations), которые затем внедряются производителями программ и оборудования. Таким образом достигается совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной. Все рекомендации консорциума Всемирной паутины открыты, то есть не защищены патентами и могут внедряться любым человеком без всяких финансовых отчислений консорциуму.

Структура и принципы Всемирной паутины

Всемирную паутину образуют миллионы веб-серверов сети Интернет , расположенных по всему миру. Веб-сервер является программой, запускаемой на подключённом к сети компьютере и использующей протокол HTTP для передачи данных. В простейшем виде такая программа получает по сети HTTP-запрос на определённый ресурс, находит соответствующий файл на локальном жёстком диске и отправляет его по сети запросившему компьютеру. Более сложные веб-серверы способны в ответ на HTTP-запрос динамически генерировать документы с помощью шаблонов и сценариев .

Для просмотра информации, полученной от веб-сервера, на клиентском компьютере применяется специальная программа - веб-браузер . Основная функция веб-браузера - отображение гипертекста . Всемирная паутина неразрывно связана с понятиями гипертекста и гиперссылки . Большая часть информации в Вебе представляет собой именно гипертекст.

Для облегчения создания, хранения и отображения гипертекста во Всемирной паутине традиционно используется язык HTML (англ. HyperText Markup Language, «язык разметки гипертекста»). Работа по созданию (разметке) гипертекстовых документов называется вёрсткой , она делается веб-мастером либо отдельным специалистом по разметке - верстальщиком. После HTML-разметки получившийся документ сохраняется в файл, и такие HTML-файлы являются основным типом ресурсов Всемирной паутины. После того, как HTML-файл становится доступен веб-серверу, его начинают называть «веб-страницей». Набор веб-страниц образует веб-сайт .

Гипертекст веб-страниц содержит гиперссылки. Гиперссылки помогают пользователям Всемирной паутины легко перемещаться между ресурсами (файлами) вне зависимости от того, находятся ресурсы на локальном компьютере или на удалённом сервере. Для определения местонахождения ресурсов во Всемирной паутине используются единообразные локаторы ресурсов URL (англ. Uniform Resource Locator). Например, полный URL главной страницы русского раздела Википедии выглядит так: http://ru.wikipedia.org/wiki/Заглавная_страница . Подобные URL-локаторы сочетают в себе технологию идентификации URI (англ. Uniform Resource Identifier - «единообразный идентификатор ресурса») и систему доменных имён DNS (англ. Domain Name System). Доменное имя (в данном случае ru.wikipedia.org) в составе URL обозначает компьютер (точнее, один из его сетевых интерфейсов), который исполняет код нужного веб-сервера. URL текущей страницы обычно можно увидеть в адресной строке браузера, хотя многие современные браузеры предпочитают по умолчанию показывать лишь доменное имя текущего сайта.

Технологии Всемирной паутины

Для улучшения визуального восприятия веба стала широко применяться технология CSS , которая позволяет задавать единые стили оформления для множества веб-страниц. Ещё одно нововведение, на которое стоит обратить внимание, - система обозначения ресурсов URN (англ. Uniform Resource Name).

Популярная концепция развития Всемирной паутины - создание семантической паутины . Семантическая паутина - это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в сети информацию более понятной для компьютеров. Семантическая паутина - это концепция сети, в которой каждый ресурс на человеческом языке был бы снабжён описанием, понятным компьютеру. Семантическая паутина открывает доступ к чётко структурированной информации для любых приложений, независимо от платформы и независимо от языков программирования . Программы смогут сами находить нужные ресурсы, обрабатывать информацию, классифицировать данные, выявлять логические связи, делать выводы и даже принимать решения на основе этих выводов. При широком распространении и грамотном внедрении семантическая паутина может вызвать революцию в Интернете. Для создания понятного компьютеру описания ресурса в семантической паутине используется формат RDF (англ. Resource Description Framework), который основан на синтаксисе XML и использует идентификаторы URI для обозначения ресурсов. Новинки в этой области - это RDFS (англ. RDF Schema) и SPARQL (англ. Protocol And RDF Query Language) (произносится как «спа́ркл»), новый язык запросов для быстрого доступа к данным RDF.

Основные применяемые термины Всемирной паутины

Работа с браузером

Сегодня, спустя десять лет после изобретения протокола HTTP , лёгшего в основу Всемирной паутины, браузер представляет собой сложнейшее программное обеспечение, сочетающее в себе лёгкость в использовании и богатство возможностей.
Браузер не только открывает пользователю мир гипертекстовых ресурсов Всемирной паутины. Он также может работать и с другими службами Сети, такими как FTP , Gopher , WAIS . Вместе с браузером на компьютер обычно устанавливается программа для пользования службами электронной почты (e-mail) и новостей (news). По сути, браузер является основной программой для доступа к службам Сети. Через него можно получить доступ практически к любой службе Интернет , даже если браузер не поддерживает работу с этой службой. Для этого используются специальным образом запрограммированные веб-сервера , которые связывают Всемирную паутину с данной службой Сети. Пример такого рода веб-серверов - многочисленные бесплатные почтовые сервера с веб-интерфейсом (см. http://www.mail.ru)
Сегодня существует множество программ-браузеров, созданных различными компаниями. Наибольшее распространение и признание получили такие браузеры, как Netscape Navigator и Internet Explorer. Именно эти браузеры составляют между собой основную конкуренцию, хотя стоит заметить, что эти программы во многом схожи. Это и понятно, ведь они работают по одинаковым стандартам – стандартам сети Интернет.
Работа с браузером начинается с того, что пользователь набирает в адресной строке (адрес) URL того ресурса, к которому он хочет получить доступ, и нажимает клавишу Enter.

Браузер посылает запрос на указанный сервер Сети. По мере того, как с сервера приходят элементы указанной пользователем веб-страницы , она постепенно появляется в рабочем окне браузера. Процесс получения элементов страницы с сервера отображается в нижней "статусной" строке браузера.

Содержащиеся в полученной веб-странице текстовые гиперссылки , как правило, выделяются цветом, отличным от цвета остального текста документа, и подчеркиваются. Ссылки, указывающие на ресурсы, которые пользователь ещё не просматривал, и ссылки на уже посещённые ресурсы обычно имеют разный цвет. Изображения также могут функционировать как гиперссылки. Независимо от того, текстовая ссылка или графическая, если навести на неё курсор мыши, его форма изменится. Одновременно в статусной строке браузера появится адрес, на который указывает ссылка.

При нажатии на гиперссылку браузер открывает в рабочем окне ресурс, на который она указывает, при этом предыдущий ресурс из него выгружается. Браузер ведёт список просматриваемых страниц и пользователь при необходимости может вернуться назад по цепочке просмотренных страниц. Для этого нужно щёлкнуть мышкой на кнопке "Назад" ("Back") в меню браузера - и он вернётся к странице, которую вы просматривали до того, как открыли текущий документ.
Каждый раз, когда вы будете нажимать на эту кнопку, браузер будет возвращаться на один документ назад в списке посещённых документов. Если вдруг вы вернулись слишком далеко назад, воспользуйтесь кнопкой "Вперёд" ("Forward") меню браузера. Она поможет вам переместиться вперёд по списку документов.
Кнопка "Стоп" ("Stop") остановит загрузку документа. Кнопка "Обновить" ("Reload") даёт возможность перезагрузить текущий документ с сервера.
Браузер в своём окне может показать лишь один документ: для показа другого документа он выгружает предыдущий. Гораздо удобнее одновременно работать в нескольких окнах браузера. Открытие нового окна осуществляется с помощью меню: Файл – Создать – Окно (или комбинацией клавиш Ctrl+N).

Работа с документом

Браузер позволяет производить над документом набор стандартных операций. Загруженную в него веб-страницу можно распечатать (в Internet Explorer это делается с помощью кнопки «Печать» ("Print") или из меню: Файл – Печать…), сохранить на диск (меню: Файл – Сохранить как…). Можно найти интересующий вас фрагмент текста в загруженной странице. Для этого используйте меню: Правка – Найти на этой странице…. А если вас интересует, как выглядит данный документ в исходном гипертексте , который обработал браузер, выберите в меню: Вид – В виде HTML.
Когда в процессе работы в Интернете пользователь находит особенно интересную для него страницу, он использует предусмотренную в браузерах возможность устанавливать закладки (по аналогии с закладками, отмечающими интересные места книги).
Это делается через меню: Избранное – Добавить в избранное. После этого новая закладка появляется в списке закладок, который можно просмотреть, нажав кнопку «Избранное» на панели браузера или через меню Избранное.
Существующие закладки можно удалять, изменять, организовывать в папки с помощью меню: Избранное – Упорядочить избранное.

Работа через прокси-сервер

В Netscape Navigator и Microsoft Internet Explorer предусмотрен также механизм для встраивания дополнительных возможностей независимыми производителями. Модули, расширяющие возможности браузера, называются плагинами (plug-in).
Браузеры работают на компьютерах под управлением самых разных операционных систем. Это даёт основание для того, чтобы говорить о независимости Всемирной паутины от типа применяемого пользователем компьютера и операционной системы.

Поиск информации в Интернете

В последнее время во Всемирной паутине видят новое мощное средство массовой информации, аудитория которого – самая активная и образованная часть населения планеты. Такое видение соответствует реальному положению дел. В дни знаменательных событий и потрясений нагрузка на сетевые узлы новостей резко увеличивается; в ответ на читательский спрос мгновенно появляются ресурсы, посвящённые только что случившемуся происшествию. Так, во время августовского кризиса 1998 года на Интернет-странице телерадиокомпании CNN (http://www.cnn.com) новости появлялись гораздо раньше, чем о них сообщали российские средства массовой информации. Тогда же получил широкую известность сервер РИА РосБизнесКонсалтинг (http://www.rbc.ru), предоставляющий свежую информацию с финансовых рынков и последние новости. Многие американцы наблюдали за ходом голосования по импичменту президенту США Биллу Клинтону в Сети, а не у экранов телевизоров. Развитие войны в Югославии также моментально получило отражение во множестве публикаций, отражающих самые разные точки зрения на этот конфликт.
Многие люди, знакомые с Интернетом больше понаслышке, считают, что в Сети можно найти любую информацию. Это действительно так в том смысле, что там можно натолкнуться на самые неожиданные по форме и содержанию ресурсы. Действительно, современная Сеть в состоянии предложить своему пользователю массу информации самого разного профиля. Здесь можно познакомиться с новостями, интересно провести время, получить доступ к разнообразной справочной, энциклопедической и учебной информации. Необходимо только подчеркнуть, что хотя общая информационная ценность Интернета очень велика, само информационное пространство неоднородно в качественном отношении, поскольку ресурсы часто создаются на скорую руку. Если при подготовке бумажной публикации её текст обычно прочитывается несколькими рецензентами и в него вносятся коррективы, то в Сети этот этап издательского процесса обычно отсутствует. Так что в общем случае к сведениям, почерпнутым из Интернета, следует относиться с несколько большей осторожностью, чем к информации, найденной в печатной публикации.
Однако у обилия информации есть и отрицательная сторона: с ростом количества информации становится всё труднее и труднее найти ту информацию, которая нужна в данный момент. Поэтому самая главная проблема, возникающая при работе с Сетью, – быстро найти нужную информацию и разобраться в ней, оценить информационную ценность того или иного ресурса для своих целей.

Для решения проблемы поиска нужной информации в Интернете существует отдельный вид сетевого сервиса. Речь идёт о поисковых серверах , или поисковых машинах.
Поисковые серверы достаточно многочисленны и разнообразны. Принято различать поисковые индексы и каталоги.
Серверы-индексы работают следующим образом: регулярно прочитывают содержание большинства веб-страниц Сети ("индексируют" их), и помещают их полностью или частично в общую базу данных. Пользователи поискового сервера имеют возможность осуществлять поиск по этой базе данных, используя ключевые слова, относящиеся к интересующей их теме. Выдача результатов поиска обычно состоит из выдержек рекомендуемых вниманию пользователя страниц и их адресов (URL), оформленных в виде гиперссылок . Работать с поисковыми серверами этого типа удобно в том случае, если имеется чёткое представление о предмете поиска.
Серверы-каталоги по сути представляют собой многоуровневую классификацию ссылок, построенную по принципу "от общего к частному". Иногда ссылки сопровождаются кратким описанием ресурса. Как правило, возможен поиск в названиях рубрик (категориях) и описаниях ресурсов по ключевым словам. Каталогами пользуются тогда, когда не вполне чётко знают, что именно ищут. Переходя от самых общих категорий к более частным, можно определить, с каким именно ресурсом Сети следует ознакомиться. Поисковые каталоги уместно сравнивать с тематическими библиотечными каталогами или классификаторами. Ведение поисковых каталогов частично автоматизировано, но до сих пор классификация ресурсов осуществляется главным образом вручную.
Поисковые каталоги бывают общего назначения и специализированные . Поисковые каталоги общего назначения включают в себя ресурсы самого разного профиля. Специализированные каталоги объединяют только ресурсы, посвящённые определённой тематике. Им часто удаётся достичь лучшего охвата ресурсов из своей области и построить более адекватную рубрикацию.
В последнее время поисковые каталоги общего назначения и индексирующие поисковые сервера интенсивно интегрируются, успешно сочетая их преимущества. Поисковые технологии тоже не стоят на месте. Традиционные индексирующие сервера ищут в базе данных документы, содержащие ключевые слова из поискового запроса. При таком подходе очень сложно оценить значение и качество ресурса, выдаваемого пользователю. Альтернативный подход – искать такие веб-страницы , на которые ссылаются другие ресурсы по данной тематике. Чем больше ссылок на страницу существует в Сети, тем больше шансов, что вы её найдёте. Такой своеобразный мета-поиск осуществляет поисковый сервер Google (http://www.google.com/), появившийся совсем недавно, но уже отлично себя зарекомендовавший.

Работа с поисковыми серверами

Работа с поисковыми серверами не составляет большого труда. В адресной строке браузера набираете его адрес, в строке запроса набираете на нужном языке ключевые слова или фразу, соответствующие ресурсу или ресурсам Сети, которые вы хотите найти. Затем нажимаете мышью на кнопку "Поиск" ("Search") и в рабочее окно браузера загружается первая страница с результатами поиска.

Обычно поисковый сервер выдаёт результаты поиска небольшими порциями, например, по 10 на одну страницу выдачи. Поэтому часто они занимают больше одной страницы. Тогда под списком рекомендуемых ссылок будет находиться ссылка, предлагающая перейти к следующей "порции" результатов поиска (см. рис.).

В идеальном случае тот ресурс, который вы ищете, поисковый сервер поместит на первую страницу результатов поиска, и вы сразу распознаете нужную ссылку по краткому описанию. Однако часто приходится просмотреть несколько ресурсов, прежде чем обнаруживается подходящий. Как правило, пользователь просматривает их в новых окнах браузера, не закрывая окно браузера с результатами поиска. Иногда поиск и просмотр найденных ресурсов ведётся в одном и том же окне браузера.
Успех поиска информации напрямую зависит от того, насколько грамотно вы составили поисковый запрос .
Рассмотрим простой пример . Предположим, вы хотите купить компьютер, но не знаете, какие модификации сегодня существуют и каковы их характеристики. Чтобы получить требуемую информацию, можно воспользоваться Интернетом , задав запрос поисковой машине. Если зададим в строке поиска слово «компьютер», то результатом поиска будет более 6 миллионов (!) ссылок. Естественно, среди них есть и страницы, удовлетворяющие нашим требованиям, однако найти их среди такого количества не представляется возможным.
Если же написать «какие модификации компьютеров существуют сегодня», то поисковый сервер предложит вам просмотреть около двухсот страниц, но ни одна из них не будет строго соответствовать запросу. Другими словами, в них встречаются отдельные слова из вашего запроса, но речь может идти совсем не о компьютерах, а, скажем, о существующих модификациях стиральных машин или о количестве компьютеров, имеющихся в наличии на складе какой-то фирмы на этот день.
Вообще, с первого раза удачно задать вопрос поисковому серверу получается не всегда. Если запрос короткий и в нём присутствуют только часто употребляемые слова, может быть найдено очень много документов, сотни тысяч и миллионы. Наоборот, если ваш запрос окажется слишком детализированным или в нём будут использованы очень редкие слова, вы увидите сообщение о том, что ресурсов, отвечающих вашему запросу, в базе сервера не найдено.
Постепенное сужение или расширение фокуса поиска через увеличение или уменьшение списка ключевых слов, замена неудачных поисковых терминов на более удачные помогут вам улучшить результаты поиска.
Кроме количества слов важную роль в запросе играет их содержание. Ключевые слова, составляющие поисковый запрос, обычно просто разделяются пробелами. Необходимо помнить, что различные поисковые сервера по-разному интерпретируют это. Некоторые из них отбирают по такому запросу только документы, содержащие все ключевые слова, то есть воспринимают пробел в запросе как логическую связку "и". Некоторые интерпретируют пробел как логическое "или" и ищут документы, содержащие хотя бы одно из ключевых слов.
При формировании поискового запроса большинство серверов позволяют в явном виде указать логические связки, объединяющие ключевые слова, и задать некоторые другие параметры поиска. Логические связки обычно обозначаются с помощью английских слов "AND", "OR", "NOT". На разных поисковых серверах при формировании расширенного поискового запроса используется разный синтаксис – так называемый язык запросов . С помощью языка запроса вы можете указать, какие слова обязательно должны встретиться в документе, каких быть не должно, какие желательны (то есть могут быть, а могут не быть).
Как правило, современные поисковые машины используют при поиске все возможные словоформы использованных слов. То есть, независимо от того, в какой форме вы употребили слово в запросе, поиск учитывает все его формы по правилам русского языка: например, если задан запрос "идти", то в результате поиска будут найдены ссылки на документы, содержащие слова "идти", "идёт", "шёл", "шла" и т.д.
Обычно на титульной странице поискового сервера присутствует ссылка "Помощь" (англ. "Help"), обратившись по которой, пользователь может ознакомиться с правилами поиска и языком запросов, используемых на данном сервере.
Еще один очень важный момент – это выбор подходящего для ваших задач поискового сервера. Если вы ищете какой-либо определённый файл, то лучше воспользоваться специализированным поисковым сервером, который индексирует не веб-страницы , а файловые архивы в Интернете . Примером таких поисковых серверов может служить FTP Search (http://ftpsearch.lycos.com), а для поиска файлов по российским архивам лучше воспользоваться российским аналогом – http://www.filesearch.ru .
Для поиска программного обеспечения используют архивы программного обеспечения, такие как http://www.tucows.com/ , http://www.windows95.com , http://www.freeware.ru .
Если веб-страница, которую вы ищете, расположена в русской части Сети, возможно, стоит воспользоваться русскими поисковыми серверами. Они лучше работают с русскоязычными поисковыми запросами, снабжены интерфейсом на русском языке.
В таблице 1 приведён список некоторых наиболее известных поисковых серверов общего назначения. Все эти сервера в настоящее время предлагают и полнотекстовый поиск, и поиск по категориям, сочетая в себе, таким образом, достоинства индексирующего сервера и сервера-каталога.

Http , которая позволит поддерживать длительное соединение, передачу данных в несколько потоков, распределение каналов передачи данных и управления ими. Если она будет реализована и будет поддерживаться стандартным программным обеспечением WWW, то это снимет вышеупомянутые недостатки. Другой путь – использование навигаторов, которые смогут локально исполнять программы на интерпретируемых языках, как, например, проект Java компании Sun Microsystems . Другой вариант решения этой проблемы – использование технологии AJAX , на основе XML и JavaScript . Это позволяет дополучать данные с сервера, когда страница WWW уже загружена с сервера.

В настоящее время наметились две тенденции в развитии Всемирной паутины: семантическая паутина и

Существует также популярное понятие Web 2.0 , обобщающее сразу несколько направлений развития Всемирной паутины.

Веб 2.0

Развитие WWW последнее время значительным образом осуществляется путём активного внедрения новых принципов и технологий, получивших общее название Web 2.0 (Веб 2.0). Сам термин Веб 2.0 впервые появился в 2004 году и призван иллюстрировать качественные изменения в WWW на втором десятилетии его существования. Веб 2.0 является логическим совершенствованием Веб. Главной особенностью является улучшение и ускорение взаимодействия веб-сайтов с пользователями, что привело к стремительному росту активности пользователей. Это проявилось в:

  • участии в Интернет-сообществах (в частности, в форумах);
  • размещении комментариев на сайтах;
  • ведении персональных журналов (блогов);
  • размещении ссылок в WWW.

Веб 2.0 ввёл активный обмен данными, в частности:

  • экспорт новостей между сайтами;
  • активная агрегация информации из сайтов.
  • использование API для отделения данных сайта от самого сайта

С точки зрения реализации сайтов Веб 2.0 повышает требования к простоте и удобству сайтов для обычных пользователей и нацелен на стремительное падение квалификации пользователей в ближайшем будущем. На передний план выносится соблюдение перечня стандартов и согласований (W3C). Это в частности:

  • стандарты визуального оформления и функциональности сайтов;
  • типовые требования (SEO) поисковых систем;
  • стандарты XML и открытого информационного обмена.

С другой стороны, в Веб 2.0 понизились:

  • требования к "яркости" и "креативности" дизайна и наполнения;
  • потребности в комплексных веб-сайтах ([http://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82-%D0%BF%D0%BE%D1%80%D1%82%D0%B0%D0%BB ]);
  • значение оффлайн-рекламы;
  • бизнес-интерес к крупным проектам.

Таким образом, Веб 2.0 зафиксировал переход WWW от единичных дорогих комплексных решений в сильно типизированных, дешёвых, лёгких в использовании сайтов с возможностью эффективного обмена информацией. Основными причинами такого перехода стали:

  • критическая нехватка качественного информационного наполнения;
  • потребность активного самовыражения пользователя в WWW;
  • развитие технологий поиска и агрегации информации в WWW.

Переход к комплексу технологий Веб 2.0 имеет такие последствия для глобального информационного пространства WWW, как:

  • успешность проекта определяется уровнем активного общения пользователей проекта и уровнем качества информационного наполнения;
  • сайты могут достигать высокой успеваемости и рентабельности без больших капиталовложений за счёт удачного позиционирования в WWW;
  • отдельные пользователи WWW могут достигать значительных успехов в реализации своих деловых и творческих планов в WWW без наличия собственных сайтов;
  • понятие персонального сайта уступает понятием "блог", "авторская рубрика";
  • появляются принципиально новые роли активного пользователя WWW (модератор форума, авторитетный участник форума, блогер).

Примеры Веб 2.0
Приведём несколько примеров сайтов, иллюстрирующих технологии Веб 2.0 и которые фактически изменили среду WWW. Это в частности:

Кроме этих проектов существуют другие проекты, которые формируют современную глобальную среду и базируются на активности своих пользователей. Сайты, наполнение и популярность которых формируются, в первую очередь, не усилиями и ресурсами их владельцев, а сообществом пользователей, заинтересованных в в развитии сайта, составляют новый класс сервисов, которые определяют правила глобальной среды WWW.

Всемирная паутина (сокращенно World Wide Web или WWW) - это единство информационных ресурсов, которые связаны между собой средствами телекоммуникаций и основаны на гипертекстовом представлении данных, разбросанных по всему миру.

Годом рождения Всемирной паутины считается 1989 год. Именно в этом году Тим Бернерс-Ли предложил общий гипертекстовый проект, который получил впоследствии название Всемирной паутины.

Создатель «паутины» Тим Бернес-Ли, работая в лаборатории физики элементарных частиц европейского центра ядерных исследований «CERN» В Женеве (Швейцария), совместно с партнером Робертом Кайо занимались проблемами применения идей гипертекста для построения информационной среды, которая упростила бы обмен информацией между физиками.

Итогом данной работы явился документ, в котором рассматривались понятия, имеющие принципиальное значение для «паутины» в ее современном виде, и были предложены идентификаторы URI, протокол HTTR и язык HTML. Без данных технологий уже нельзя представить современный Интернет.

Бернерс-Ли создал первый в мире веб-сервер и первый в мире гипертекстовый веб-браузер. На первом в мире веб-сайте он описал, что такое Всемирная паутина и как установить веб-сервер, как использовать браузер и т.п. Этот сайт являлся и первым в мире Интернет-каталогом.

Начиная с 1994 года самые главные задачи по развитию Всемирной паутины взял на себя Консорциум Всемирной паутины (World Wide Web Consortium, WЗС ), который организовал и до сих пор возглавляет Ким Бернес-Ли. Консорциум разрабатывает и внедряет технологические стандарты для Интернета и Всемирной паутины. Миссия WЗС: «Полностью раскрыть потенциал Всемирной паутины, путем создания протоколов и принципов, гарантирующих долгосрочное развитие Сети» . WЗС разрабатывает «Рекомендации», что бы достичь совместимость между программными продуктами и аппаратурой различных компаний, что делает Всемирную сеть более совершенной, универсальной и удобной.

Поисковые системы: состав, функции, принципы работы.

Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google» , «Yahoo» , «MSN» . В русском Интернете это – «Яндекс» , «Рамблер» , «Апорт» .

Опишем основные характеристики поисковых систем :

    Полнота

Полнота - одна из основных характеристик поисковой системы, представляющая собой отношение количества найденных по запросу документов к общему числу документов в сети Интернет, удовлетворяющих данному запросу. К примеру, если в Интернете имеется 100 страниц, содержащих словосочетание «как выбрать автомобиль», а по соответствующему запросу было найдено всего 60 из них, то полнота поиска будет 0,6. Очевидно, что чем полнее поиск, тем меньше вероятность того, что пользователь не найдет нужный ему документ, при условии, что он вообще существует в Интернете.

    Точность

Точность - еще одна основная характеристика поисковой машины, которая определяется степенью соответствия найденных документов запросу пользователя. Например, если по запросу «как выбрать автомобиль» находится 100 документов, в 50 из них содержится словосочетание «как выбрать автомобиль», а в остальных просто наличествуют эти слова («как правильно выбрать магнитолу и установить в автомобиль»), то точность поиска считается равной 50/100 (=0,5). Чем точнее поиск, тем быстрее пользователь найдет нужные ему документы, тем меньше различного рода «мусора» среди них будет встречаться, тем реже найденные документы не будут соответствовать запросу.

    Актуальность

Актуальность - не менее важная составляющая поиска, которая характеризуется временем, проходящим с момента публикации документов в сети Интернет, до занесения их в индексную базу поисковой системы. Например, на следующий день после появления интересной новости, большое количество пользователей обратились к поисковым системам с соответствующими запросами. Объективно с момента публикации новостной информации на эту тему прошло меньше суток, однако основные документы уже были проиндексированы и доступны для поиска, благодаря существованию у крупных поисковых систем так называемой «быстрой базы», которая обновляется несколько раз в день.

    Скорость поиска

Скорость поиска тесно связана с его устойчивостью к нагрузкам. Например, по данным ООО «Рамблер Интернет Холдинг», на сегодняшний день в рабочие часы к поисковой машине Рамблер приходит около 60 запросов в секунду. Такая загруженность требует сокращения времени обработки отдельного запроса. Здесь интересы пользователя и поисковой системы совпадают: посетитель желает получить результаты как можно быстрее, а поисковая машина должна отрабатывать запрос максимально оперативно, чтобы не тормозить вычисление следующих запросов.

    Наглядность

Наглядность представления результатов является важным компонентом удобного поиска. По большинству запросов поисковая машина находит сотни, а то и тысячи документов. Вследствие нечеткости составления запросов или неточности поиска, даже первые страницы выдачи не всегда содержат только нужную информацию. Это означает, что пользователю зачастую приходится производить свой собственный поиск внутри найденного списка. Различные элементы страницы выдачи поисковой системы помогают ориентироваться в результатах поиска.одробные пояснения по странице результатов поиска, например у «Яндекса» можно посмотреть по ссылке http://help.yandex.ru/search/?id=481937 .

Краткая история развития поисковых систем

В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации сравнительно небольшим. В большинстве своем, доступ к сети Интернет имели лишь сотрудники научно-исследовательской сферы. В это время задача поиска информации в Интернете не была столь актуальной, как в настоящее время.

Одним из первых способов организации доступа к информационным ресурсам сети стало создание открытых каталогов сайтов, ссылки на ресурсы в которых группировались согласно тематике. Первым таким проектом стал сайт Yahoo.com, открывшийся весной 1994 года. После того, как количество сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска нужной информации по каталогу. В полном смысле это еще не было поисковой системой, так как поисковая область была ограничена только ресурсами, присутствующими в каталоге, а не всеми Интернет ресурсами.

Каталоги ссылок широко использовались ранее, однако практически полностью утратили свою популярность в настоящее время. Так как даже современные, огромные по своему объему каталоги, содержат информацию лишь о ничтожно малой части сети Интернет. Самый большой каталог сети DMOZ (его еще называют Open Directory Project) содержит информацию о 5 миллионах ресурсов, тогда как база поисковой системы Google состоит из более чем 8 миллиардов документов.

Первой полноценной поисковой системой стал проект WebCrawler, вышедший в свет в 1994 году.

В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в сети Интернет.

В 1997 году Сергей Брин и Ларри Пейдж создали поисковую машину Google в рамках исследовательского проекта в Стэндфордском университете. В настоящий момент Google - самая популярная поисковая система в мире!

В сентябре 1997 года была официально анонсирована поисковая система Yandex, являющаяся самой популярной в русскоязычном Интернете.

В настоящее время существуют три основные международные поисковые системы – Google, Yahoo и MSN, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих насчитывается большое количество) использует в том или ином виде результаты трех перечисленных. Например, поиск AOL (search.aol.com) использует базу Google, а AltaVista, Lycos и AllTheWeb – базу Yahoo.

Состав и принципы работы поисковой системы

В России основной поисковой системой является «Яндекс», далее - Rambler.ru, Google.ru, Aport.ru, Mail.ru. Причем, на данный момент, Mail.ru использует механизм и базу поиска «Яндекса».

Практически все крупные поисковые системы имеют свою собственную структуру, отличную от других. Однако можно выделить общие для всех поисковых машин основные компоненты. Различия в структуре могут быть лишь в виде реализации механизмов взаимодействия этих компонентов.

Модуль индексирования

Модуль индексирования состоит из трех вспомогательных программ (роботов):

Spider (паук) – программа, предназначенная для скачивания веб-страниц. «Паук» обеспечивает скачивание страницы и извлекает все внутренние ссылки с этой страницы. Скачивается html-код каждой страницы. Для скачивания страниц роботы используют протоколы HTTP. Работает «паук» следующим образом. Робот на сервер передает запрос “get/path/document” и некоторые другие команды HTTP-запроса. В ответ робот получает текстовый поток, содержащий служебную информацию и непосредственно сам документ.

    URL страницы

    дата, когда страница была скачана

    http-заголовок ответа сервера

    тело страницы (html-код)

Crawler («путешествующий» паук) – программа, которая автоматически проходит по всем ссылкам, найденным на странице. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Crawler, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.

Indexer (робот- индексатор) - программа, которая анализирует веб-страницы, скаченные пауками. Индексатор разбирает страницу на составные части и анализирует их, применяя собственные лексические и морфологические алгоритмы. Анализу подвергаются различные элементы страницы, такие как текст, заголовки, ссылки структурные и стилевые особенности, специальные служебные html-теги и т.д.

Таким образом, модуль индексирования позволяет обходить по ссылкам заданное множество ресурсов, скачивать встречающиеся страницы, извлекать ссылки на новые страницы из получаемых документов и производить полный анализ этих документов.

База данных

База данных, или индекс поисковой системы - это система хранения данных, информационный массив, в котором хранятся специальным образом преобразованные параметры всех скачанных и обработанных модулем индексирования документов.

Поисковый сервер

Поисковый сервер является важнейшим элементом всей системы, так как от алгоритмов, которые лежат в основе ее функционирования, напрямую зависит качество и скорость поиска.

Поисковый сервер работает следующим образом:

    Полученный от пользователя запрос подвергается морфологическому анализу. Генерируется информационное окружение каждого документа, содержащегося в базе (которое и будет впоследствии отображено в виде сниппета, то есть соответствующей запросу текстовой информации на странице выдачи результатов поиска).

    Полученные данные передаются в качестве входных параметров специальному модулю ранжирования. Происходит обработка данных по всем документам, в результате чего, для каждого документа рассчитывается собственный рейтинг, характеризующий релевантность запроса, введенного пользователем, и различных составляющих этого документа, хранящихся в индексе поисковой системы.

    В зависимости от выбора пользователя этот рейтинг может быть скорректирован дополнительными условиями (например, так называемый «расширенный поиск»).

    Далее генерируется сниппет, то есть, для каждого найденного документа из таблицы документов извлекаются заголовок, краткая аннотация, наиболее соответствующая запросу и ссылка на сам документ, причем найденные слова подсвечиваются.

    Полученные результаты поиска передаются пользователю в виде SERP (Search Engine Result Page) – страницы выдачи поисковых результатов.

Как видно, все эти компоненты тесно связаны друг с другом и работают во взаимодействии, образовывая четкий, достаточно сложный механизм работы поисковой системы, требующий огромных затрат ресурсов.

Ни одна поисковая система не охватывает все ресурсы Интернет.

Каждая поисковая система собирает сведения о ресурсах Интернет, применяя свои уникальные методы, и формирует собственную периодически обновляемую базу данных. Доступ к этой базе предоставляется пользователю.

Поисковые системы реализуют два способа поиска ресурса:

    Поиск по тематическим каталогам - информация представляется в виде иерархической структуры. На верхнем уровне - общие категории (“Интернет”, “Бизнес”, “Искусство”, “Образование” и т.д.), на следующем уровне категории делятся на разделы и т.д. Самый нижний уровень - ссылки на конкретные веб-страницы или другие информационные ресурсы.

    Поиск по ключевым словам (индексный поиск или детальный) - пользователь отправляет поисковой системе запрос , состоящий из ключевых слов. Система возвращает пользователю перечень найденных по запросу ресурсов.

Большинство поисковых систем сочетают оба способа поиска.

Поисковые системы могут быть локальными, глобальными, региональными и специализированными.

В русской части Интернет (Рунет) наиболее популярны сейчас поисковые системы общего назначения Rambler (www.rambler.ru), Яндекс (www.yandex.ru), Апорт (www.aport.ru), Гугл (www.google.ru).

Большинство поисковых систем реализовано в виде порталов.

Портал (от англ. portal - главный вход, ворота) -это веб-сайт, который интегрирует различные сервисы Интернет: средства поиска, почту, новости, словари и т.д.

Порталы могут быть специализированными (как, www . museum . ru ) и общими (например, www . km . ru ).

Поиск по ключевым словам

Набор ключевых слов, по которым ведется поиск, называют также критерием поиска или темой поиска.

Запрос может состоять как из одного слова, так и из сочетания слов, объединенных операторами - символами, по которым система определяет, какое действие ей нужно произвести. Например: запрос “Москва Питер” содержит оператор И (так воспринимается пробел), который указывает, что надо искать документы, в которых есть оба слова - и Москва, и Питер.

Для того, чтобы поиск был релевантным (от англ. relevant -уместный, относящийся к делу), следует учитывать несколько общих правил:

    Независимо от того, в какой форме употреблено слово в запросе, поиск учитывает все его словоформы по правилам русского языка. Например, по запросу “билет” будут найдены и слова “билетом”, “билету” и т.д.

    Заглавные буквы следует использовать только в именах собственных, чтобы не просматривать лишние ссылки. По запросу “кузнецов”, например, будут найдены документы, где говорится и о кузнецах, и о Кузнецовых.

    Желательно сужать круг поиска, используя несколько ключевых слов.

    Если нужного адреса нет среди первой двадцатки найденных адресов, следует изменить запрос.

Каждая поисковая система использует свой язык запросов. Для знакомства с ним, пользуйтесь встроенной справкой поисковой системы

Крупные сайты могут иметь встроенные системы поиска информации в пределах своих веб-страниц.

Запросы в подобных системах поиска, как правило, строятся по тем же правилам, что и в глобальных поисковых системах, однако знакомство со справкой и здесь не будет лишним.

Расширенный поиск

Поисковые системы могут предоставлять в распоряжение пользователя механизм, позволяющий формировать сложный запрос. Переход по ссылке Расширенный поиск дает возможность редактировать параметры поиска, указывать дополнительные параметры и выбирать наиболее удобную форму показа результатов поиска. Ниже описаны параметры, которые могут быть заданы при расширенном поиске в системах Япс1ех и Rambler.

Описание параметра

Название в Яндекс

Название в Rambler

Где искать ключевые слова (заголовок документа, основной текст и т.д.)

Словарный фильтр

Поиск по тексту...

Какие слова должны или не должны присутствовать в документе и насколько точным должно быть совпадение

Словарный фильтр

Искать слова запроса... Исключить документы, содержащие следующие слова...

На каком расстоянии друг от друга должны располагаться ключевые слова

Словарный фильтр

Расстояние между словами запроса...

Ограничение на дату документа

Дата документа...

Ограничение поиска пределами одного или нескольких сайтов

Сайт/Вершина

Искать документы только на следующих сайтах...

Ограничение поиска по языку документа

Язык документа...

Поиск документов, содержащих картинку с определенным именем или подписью

Изображение

Поиск страниц, содержащих объекты

Специальные объекты

Форма представления результатов поиска

Формат выдачи

Вывод результатов поиска

Некоторые поисковые системы (например, Яндекс) позволяют вводить запросы на естественном языке. Вы пишите, что нужно найти (например: заказ билетов на поезд из Москвы в Питер). Система анализирует запрос и выдает результат. Если он Вас не устраивает, переходите на язык запросов.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: