Азбука Интернета

Кто ищет, тот всегда найдет

Их любят школьники, без них никак не обойтись студентам, они – незаменимые помощники в работе людей самых разных профессий: от журналистов до ученых. Одним словом, полезность в нашем повседневном меню блюд из раздела «поисковики» сегодня оценена по достоинству вполне разношерстной публикой.

И трудно даже себе представить, что когда-то в мире не было ни одного поисковика, в то время когда Интернет уже существовал.

ПоисковикиКак бы мы основательно не «подсели» на поисковые системы, сколько бы ни казалось нам, что они существуют уже целую вечность, это сравнительно молодое изобретение. Хотя гипотеза о необходимости так сказать уложить все достижения человечества в одну энциклопедию, где без труда можно было отыскать любой термин, зародилась еще в 1945 году. Мысль сия была озвучена американским ученым Вэннивером Бушем в статье «Как мы можем думать», опубликованной в газете «The Atlantic Monthly». Он предложил наз-вать эту «единую оболочку для знаний всего человечества» незамысловатым словом «мемекс». Вот отрывок из этой статьи, который привлек меня более всего: «Суммирование опыта человечества сегодня происходит в огромных размерах, а средства, которые мы используем, чтобы пробиться сквозь логические лабиринты к сиюминутной важной цели остаются теми же, что мы использовали во времена кораблей с прямым парусным вооружением».

Потребовалось ни много ни мало 45 лет, чтобы человечество обратило-таки внимание на слова Буша и студент Алаг Эмтейдж из Университета МакГилл в Монреале спроектировал первую поисковую систему. Изначально Алаг назвал ее «Archive» («Архивы»), но после сократил до «Archie». Конструкция ее была проста - «Archie» стала базой данных веб-ресурсов в сети. Было еще несколько попыток создать подобные поисковые системы - «Veronica», «Wandex», «Aliweb» - но все они так же, как и их предшественники, были весьма несовершенны - каждый занесенный в такую базу ресурс имел только одно определенное имя, по которому он и искался.

Эта проблема была решена в 1994 году с запуском первой полноценной поисковой системы, способной искать по любым ключевым словам на любой веб-странице -  «WebCrawler». Она же и стала первой поисковой системой, известной в широких кругах.

История одной диссертации

«Люди не давали нам шансов еще десять лет назад».
Д. Янг и Д. Фило, 2007г.

yahoo!Тогда же, в 94-м, появился небезызвестный в наши дни поисковик «Yahoo». А был спроектирован он студентами Стэндфордского университета Джерри Янгом и Дэвидом Фило в процессе подготовки диссертации в области компьютерного проектирования интегральных схем. Так вот, подготавливая свой проект, они долгое время проводили в сети Интернет и, накопив достаточно внушительное количество ссылок, решили их отсортировать по категориям, потом – по подкатегориям. Далее ценные данные бережно были переданы близким друзьям для личного пользования, ну а у тех нашлось немало собственных близких друзей… Одним словом «Yahoo» пошел по рукам. А тем временем Янг и Фило забросили свои диссертации и принялись совершенствовать свой пока еще каталог, который совсем скоро обретает форму домена второго уровня – так появляется, собственно, www.yahoo.com.

«Yahoo» приобретал всю большую популярность, однако предоставлял возможность поиска только по зарегистрированным в нем ресурсам. К тому же, сайтов становилось все больше и больше, а каталог все более конкретизировался. Поэтому, чтобы найти нужную информацию пользователю приходилось проходить по 7-8 подкатегорий, в которых запросто можно было свернуть ни туда. И надо сказать, что полноценным поисковиком «Yahoo» стал только в 2004 году. Сегодня «Yahoo» предпочитает незначительная часть пользователей рунета. Но русскоязычный пользователь и не является для него главной целью, он всеязычен. Поэтому если говорить о его месте в мировом интернет-пространстве, то «Yahoo» занимает в нем по популярности 2-е место.

Что же ты ищешь, мальчик-бродяга?

1995 год ознаменовался появлением таких поисковых систем, как «AltaVista», «Excite» и многих других, нашему, казахстанскому уху незнакомых. Одним словом, на Западе в это дело втянулись все, кто только мог. А вот русскоязычная часть пользователей все еще оставалась не у дел. Исправить данную оплошность решились Сергей Лысаков и Дмитрий Крюков, создав в 1996 году поисковую систему «Rambler». Дело было в Пущино - ничего примечательного, простой город ботаников. С биологией, собственно говоря, были связаны и будущие изобретатели. Дмитрий Крюков, к примеру, создавал уникальную гигантскую электронную катротеку микроорганизмов.

Еще в 1991 году судьба свела его с Сергеем Лысаковым, впоследствии основавшим с группой единомышленников компанию «Стек», занимавшуюся локальными сетями и подключением к сети Интернет. И, надо сказать, именно «стековцы» вывели Россию на просторы мирового Интернета.

RamblerНе удивительно, что и решение о создании первой в России поисковой машины пришло в голову именно этим пытливым умам. Название поисковику придумал Дмитрий, найдя его в словаре иностранных слов. В переводе на русский оно означает – «скиталец», «бродяга». И это имя как нельзя лучше подходило для программы, которая блуждает по интернет-простарнству в поисках нужной информации. Изобретение это было на первый взгляд не вполне обосновано. Во-первых, рунет в то время составляли порядка 30-50 веб-сайтов, во-вторых, для запуска системы требовалось дорогостоящее оборудование, для покупки которого изобретателям пришлось сократить себе зарплаты. Тем не менее, 8 октября 1996 года поисковик сделал свой первый вздох.

С тех пор «Rambler» органично рос и развивался, представив виртуальной публике вскоре уникальный рейтинг-классификатор «Rambler's Top100», объективно характеризующий популярность российских интернет-ресурсов, заставив их таким образом вести конкурентную борьбу между собой. Сегодня «Rambler» отдают предпочтение 10,6 % обитателей рунета.

Найдется все

YandexСледующий же год ознаменовался появлением в сети поисковой системы «Aport». Она и сегодня «ищет, что надо», но особой популярностью в наших кругах не пользуется. Поэтому перейдем сразу к году 1997-му, когда на радость нам  появился «Яндекс», по последним данным концентрирующий внимание 44,4 % пользователей рунета. Как это не удивительно, но изначально «Яндекс» не являлся поисковой машиной, www.yandex.ru запустили для демонстрации возможностей новейшей технологии поиска, которую он собой представлял. А разработана она была программистом Аркадием Воложем, по роду своей деятельности занимающимся поиском в базах данных патентов. Волож и не собирался регистрировать в Интернете собственный поисковик, он хотел продать разработанную им технологию, но покупателя на нее так и не нашлось. А между тем «Яндекс» был просто уникальным изобретением – он первым стал вести поиск с учетом морфологии русского языка, то есть позволял искать слова в любом роде, числе и падеже.              

Одним словом, было принято решение запустить поисковик своими силами, и, надо же, он оказался востребован, хотя первые письма на электронный ящик его изобретателей были весьма саркастического содержания. Дело в том, что изначально логотип «Яндекса» был расположен под углом к поисковой строке, что вызвало поток писем, вопрошающих: «Неужели не могли бумажку в сканер ровно положить?». Само слово «Яндекс» было придумано Воложем совместно с одноклассником Ильей Сегаловичем. Оно стало производным от английского «index» и русского «языковой», а одним словом «языковой индексатор». Оригинальность конструкции этой машины была оценена по достоинству и уже в 1998 году «Яндекс» начал приносить ее владельцам первую прибыль, став в последствии самым популярным поисковиком рунета. К тому времени неуемные студенты Стендфордского университета уже готовили свое новое открытие – систему «Google», которой сегодня принадлежит 32% аудитории рунета.

Шел 1998 год. Поисковые технологии были уже вполне развиты и обитатели сети вели борьбу за первые строки поисковиков. Как раз в это время поисковыми технологиями заинтересовались стендфордские студенты-программисты Сергей Брин и Ларри Пейдж. «Page rank» – так была названа изобретенная ими система, в основе которой лежал так называемый «индекс цитирования». Суть его проста – ранжирование в поисковике по близости к началу списка зависит от количества и качества ссылок на данный ресурс. При этом качество подразумевает в свою очередь количество ссылок на сайт ссылающегося, так называемый авторитет цитирующего.

GoogleКак и их пущинские коллеги, Сергей и Ларри не собирались создавать собственный поисковик, а хотели лишь продать изобретенную технологию. И так же, как Волож с единомышленниками, пришли к выводу, что без этого не обойтись. Так появился «Google». В результате действенность системы «Page rank» была признана во всем мире и сегодня ее с успехом используют такие поисковики, как «Аport»,«Mail», «Yahoo» и многие другие, а сам «Google» является самым популярным поисковиком в мире. Во многом этому способствовало отсутствие излишней инфраструктуры в поисковике (при входе в систему вниманию пользователей предоставляется лишь строка поиска, ничего более), а также скорость поиска, которая составляет сегодня менее секунды.

Пауки-работяги

Несмотря на уникальность технологий поиска информации каждого отдельного поисковика, в основе их работы лежит более-менее общий алгоритм. Итак, каждый поисковик состоит из нескольких компонент:

- паука, который скачивает веб-страницы;

-  путешествующего  паука, который проходит по всем ссылкам, найденным на странице;

-  индексатора, который анализирует веб-страницы, скаченные пауком;

- базы данных, которая хранит скаченные файлы;

- системы выдачи результатов, которая решает, какие из найденных страниц удовлетворяют запросу пользователя.

Рыская по просторам Интернета, пауки ориентируются на ключевые слова, присваеваемые веб-мастерами разработанному ими сайту. Эта информация при открытии сайта нам не видна, однако ее можно просмотреть, кликнув правой клавишей мыши в поле сайта и выбрав «Исходный текст».

Предстающий вниманию человека несведущего при этом текст ничего ценного собой не представляет, зато для поисковой машины это самый важный ориентир. Здесь записаны те слова, которые, по мнению разработчика сайта, будут набирать пользователи для поиска содержащейся на сайте информации. В этом как раз-таки и возникает главная проблема веб-поиска, остающаяся без решения до сих пор. Веб-мастера вбивают в ключевые слова вполне внятный и грамотный текст (допустим, для производителей напитков выражение «продам напитки»), в то время как запросы пользователей не всегда корректны и грамотны (для поиска того же веб-ресурса может быть набрано что-нибудь вроде «где взять напитки в Казахстане?»). Кроме того, внимание паучка привлекают заголовки, выделенные слова (жирным шрифтом, курсивом или подчеркиванием), а также частота повторений ключевых слов непосредственно в тексте файла (их вес). При использовании поисковой машины «Google», как уже было сказано ранее, также используется информация о количестве и качестве ссылок веб-ресурса. 

Так вкратце и работают поисковые машины, предоставляя нам возможность находить любую необходимую  информацию, а Вам, уважаемые предприниматели, кроме того, возможность находить новых клиентов и партнеров. Притом Ваши шансы несоизмеримо увеличиваются при условии наличия собственного веб-сайта. Он позволяет Вам обрести так сказать свое лицо в веб-паутине, которое со временем благодаря паукам-трудягам становится все узнаваемее. И сегодня компания «SemStar», от лица которой я предоставляю Вам данную информацию, рада предложить Вам услуги по разработке и продвижению во всех вышеупомянутых поисковых машинах персональных веб-сайтов для Вашего бизнеса.

Поделиться в соцсетях

Комментарии ()

    Вы должны авторизоваться, чтобы оставлять комментарии.
    Авторизация