Поисковая система "апорт". Поисковая система "апорт" Поисковая система aport

В конце 90х годов прошлого века, когда Российский Интернет стал обрастать всеми положенными атрибутами появились и наши известные сейчас всем поисковые системы. Почти одновременно появились Апорт (февраль 1996), Рамлер (8 октября 1996), Яндекс (23 сентября 1997). Апорт являлся одной из первых в России поисковой системой.

Поисковая система Апорт глазами Wiki

Впервые была продемонстрирована в феврале 1996 года на пресс-конференции «Агамы» по поводу «Русского клуба». На тот момент поисковая машина искала только по сайту russia.agama.com . В дальнейшем был поиск по четырём серверам, потом по шести. В итоге день рождения Апорта и фактический старт системы сильно «размазались» по времени. Официальная презентация Апорта состоялась только 11 ноября 1997 года, тогда машина уже индексировала весь рунет (в поисковой системе Апорт был проиндексирован первый миллион документов, расположенных на 10 тысячах серверов).

На текущий момент Апорт является частью портала РОЛ. Принадлежит Golden Telecom. При поиске учитываются особенности русского языка.

До начала 2000-х годов являлась неоспоримым лидером поиска в Рунете, а с покупкой Агамы РОЛом почти вся разработка была прекращена и поисковая система стала резко сдавать позиции, заметно уступая по популярности Рамблеру и Яндексу.

Опыт и наработки поисковой системы «Апорт» были использованы при создании новой поисковой системы gogo.ru (владелец Mail.Ru).

Особенности Апорт

К важным свойствам первой версии поисковой системы Апорт можно отнести перевод запроса и ответа на английский язык и обратно. Второе свойство – реконструкция проиндексированных страниц из собственной базы. Это дает возможность просмотра уже несуществующих страниц.

Поисковая система Aport 2000 была построена на основе выдачи результатов по отдельно взятым сайтам. Для разделения ресурсов на сайты Апорт использует информацию, которую предоставляет каталог AtRus, или владельцы ресурсов.

www.aport.ru – первым из поисковых систем Рунета реализовал базовые технологии Google. «Page rank» - характеристика популярности ресурса по формуле «обратных ссылок»: ссылки с других сайтов на данный ресурс. Причем учитывается не только количество, но и важность ссылок. Вес ссылки с популярного сайта больше, а ссылки включающие слова запроса ценятся выше, чем ссылки со словом «здесь». К тому же, при обработке запроса поисковая система Aport 2000 ориентируется на HTML – код страницы, и наличие слов запроса в URL.

Еще одна особенность приоритет сайтам, вошедшим в высшую и элитную лиги Апорт – Каталог. В поисковой системе Aport впервые была реализована возможность поиска по новостным лентам.

Масштабируемость в архитектуре Aport 2000 построена таким образом, что его поисковую базу можно дробить на несколько отдельных фрагментов, каждый из которых будет работать на своем компьютере. После поиска по фрагментам для пользователя рассчитывается общий ответ.

Вернемся в текущее время

Сейчас Апорт не видно и не слышно.

Когда я перевел свой сайт на платный хостинг в январе - феврале 2008 года, сразу же предложил его для регистрации в поисковой системе и каталоге АПОРТ. Так с тех пор эта история и тянется

Если, более чем через год, «паук» АПОРТа все-таки начал заходить на мой сайт, то в каталоге его так до сих пор и нет.

Все это время при попытке зарегистрировать сайт я вижу:

Так сайт и проверяется, уже скоро как два года. Может это попытка направить сайт на платную регистрацию? Так нигде на Апорте не говорится о платной регистрации в каталоге. Говорится только о дополнительных платных услугах.

А вчера полазил по сайтам нескольких поисковиков и обратил внимание на интересную тенденцию. Нигде не нашел даже упоминаний о каталогах.

Это и понятно, поисковый сервис работает не с каталогами, а формирует свою базу данных по сайтам с помощью специальных программных модулей - роботов (пауков) индексируя содержимое сайта по своим типовым выборкам. И успешные поисковые сервисы считают своим успехом проиндексировать максимум сайтов - это дает возможность привлечь больше пользователей на их поисковый сервис. Эти индексы опираются не на заявленное содержимое сайта, как это происходит с каталогами, а на его реальное содержание. В этом случае полностью отпадает необходимость в каталогах. Поэтому пишу здесь о каталоге АПОРТ только как о показателе работы фирмы.

Сейчас, интерес поисковой системы не в копейках полученных от регистрации в каталоге, а в тысячах $ полученных от потока посетителе и просмотра рекламы. И чем больше пользователей сервисом поисковой системы, тем больше этих тысяч текущих на счета. А количество пользователей поисковой системой на прямую зависит от удовлетворения пользователей качеством поиска. Один из факторов этого качества как раз и есть полное и быстрое индексирование Интернет.

*(Наряду конечно с качеством анализа запроса и выдачи именно того контента который необходим давшему запрос.)

Наглядный пример Goo...oogl (для которого я бы исключил из его достоинств*). и его сегодняшние финансовые возможности.

Но вернусь к АПОРТу и попробую сравнить его с работу с другими поисковиками на основе статистики моего сайта.

В течении месяца мой сайт посещают более 30 (30 - 40) роботов (пауков) разных поисковых систем.

Состояние за январь 2010 года и на 5 февраля 2010 года, по данным статистики моего сайта , приведены ниже:

Роботы/Пауки посетители Хиты Последний визит Хиты Последний визит
За январь 2010 На 05.02.10
33 различные роботы 19 различные роботы
Yahoo Slurp 2633+127

31 . 01.10

265+15 05.02.10
Yandex bot 1984+166 31.01.10 318+25 05.02.10
Googlebot 800+219 31.01.10 69+32 05.02.10
MSNBot 435+384 31.01.10 73+52 05.02.10
StackRambler 622+5 31.01.10 114+1 04.02.10
robot identified by "crawl" 433+59 31.01.10 18+4 03.02.10
robot identified by "robot" 396+43 31.01.10 17+6 05.02.10
Java (Often spam bot) 354 17.01.10
The World Wide Web Worm 263+9 29.01.10 2+2 05.02.10
robot identified by "bot/" or "bot-" 46+35 28.01.10 8+7 04.02.10
Speedy Spider 28+27 31.01.10 1+1 03.02.10
Ask 25+20 31.01.10
Alexa (IA Archiver) 23+18 29.01.10 1+1 01.02.10
robot identified by hit on "robots.txt" 0+37 30.01.10 0+12 05.02.10
Google AdSense 11+18 31.01.10 2+3 03.02.10
HTTrack off-line browser 27 28.01.10
BaiDuSpider 1+18 29.01.10 1+2 04.02.10
arks 7+12 22.01.10
Aport 16 26.01.10 6 04.02.10
Heritrix 10+1 01.01.10
VSE 11 09.01.10
MSIECrawler 8
Powermarks 7 29.01.10
robot identified by "spider" 3+3 29.01.10
SurveyBot 3+3 25.01.10
larbin 3+3 25.01.10
The web archive (IA Archiver) 0+5 31.01.10 0+3 04.02.10
NG 1.x (Exalead) 3 25.01.10
Python-urllib 3 20.01.10
psbot 1+1 25.01.10
Yahoo! Slurp China 1+1 12.01.10
MJ12bot 1+1 31.01.10
CFNetwork 1 27.01.10 1 03.02.10
Ask 8+5 05.02.10
W3C Validator 2 04.02.10

Таблица 1.

В таблицу 1, для наглядности, я включены все роботы (пауки) пришедшие на мой сайт за рассматриваемый период. На мой взгляд порядковые номера в данном списке почти соответствуют месту поисковика в Рунет. Дата последнего захода оставлена поскольку она, в некоторой степени, характеризует активность поисковика. Общее число зашедших на сайт роботов за рассматриваемый период 35.

Ссылки из поисковых систем Страницы Процент Страницы Процент
За январь 2010 На 05.01.10
Yandex 9643 62 % 954 50.2 %
Google 5651 36.3 % 903 47.5 %
Rambler 119 0.7 % 28 1.4 %
Unknown search engines 90 0.5 % 8 0.4 %
Google (Images) 23 0.1 % 3 0.1 %
Aport 6 0 % 1 0%
Yahoo! 4 0 % 3 0.1 %
MetaBot 1 0 %

Таблица 2.

По крайней мере Yandex держит первенство и тут и выше.

Но последняя таблица, в некоторой степени, характеризует популярность поисковика.

Из таблицы 2 понятна низкая популярность АПОРТа (менее 0,004%). Она определяется не только наличием ресурса в каталоге, но и низкой активностью системы. Например из таблицы 1 видим что активность роботов АПОРТа составляет менее 0,2%.

В ряде публикаций это объясняется недостатком финансирования. Хотя объемы финансирования других поисковиков напрямую зависят от их популярности. Объемы финансирования, в конечном счете, определяется объемом зарабатываемых денег, на что в первую очередь влияет их популярность.

На мой взгляд это просто плохой менеджмент.

Обращает на себя внимание положение компании Яндекс, которая имеет около 30 различных сервисов, но активность ее поисковой системы в Рунет заслуживает самых высоких похвал (таб. 1 дает 24% от общего числа проиндексированных хитов). Как видим из таблицы 1, число переходов на мой сайт из поисковой системы Яндекс составило (в январе 2010 года) 62%, что превысило число переходов Google (36%) почти в два раза. Это в сумме более 98% или основная масса переходов.

Мы видим в таблице 2 поисковик Рамблер на третьем месте с 0,7% от общего числа переходов, а в таблице 1 на пятом с 7,5% проиндексированных роботом хитов. Это может объясняться широтой охвата компанией сервисов Интернет, где поисковик только малая доля, пропорционально ему и внимание компании к поисковому сервису. Возможно его тоже ждет судьба АПОРТа?

Имеет место низкий уровень переходов с поисковой системы Yahoo. При активности индексации хитов роботом Yahoo Slurp (32%) число переходов составило только 4 не процентов а в абсолютном значении. Я это объясняю тем что мой сайт является сайтом с русскоязычным содержимым. Но не смотря на это интересен тот факт, что число посетителей из US в январе 2010 года составило 296 хитов или 117 страниц, что составило около 1%.

Хочу отметить новое явление в Интернет.

Появились множество систем позиционирующихся как поисковая система, но таковыми в полном смысле они не являются. Часто это каталоги, а иногда поисковики использующие чужие базы данных для своего поиска. Конечно есть вероятность что их роботы просто не идентифицируются и входят в число «robot identified by ….. », а переход определяется как «Unknown search engines».

На моем сайте некоторая часть ссылок с поисковиков позиционируются как сайты с которых осуществляются переходы:

Url из 257 азличных Страницы Процент
Y andex сервисы проходящие как ссылки со страниц сайтов
http://yandex.ua/ 671 25.8 %
http://yandex.kz/ 111 4.2 %
http://yandex.03compu.ru 1 0%
http://ya.03compu.ru 4 0.1 %
http://mail.yandex.ua/ 3 0.1 %
http://images.yandex.ua/ 3 0.1 %
http://images.yandex.ua/ 53 2%
http://images.yandex.kz/ 6 0.2 %
http://hghltd.yandex.net/ 2 0%
Nigma проходит как ссылки со страниц сайтов
http://www.nigma.ru/ 104 4%
http://nigma.ru/ 70 2.7 %
Google сервисы проходящие как ссылки со страниц сайтов
http://www.googl.com.ua/ 1 0%
http://googl.com.ua/ 1 0%
http://gogle.com.ua/ 3 0.1 %
http://74.125.77.132/search 2 0%
http://209.85.135.132/search 9 0.3 %
http://209.85.129.132/search 3 0.1 %
Существуют и другие IP адреса
Mail. ru поисковые сервисы проходящие как ссылки со страниц сайтов
http://gogo.ru/ 3 0.1 %
http://go.mail.ru/ 458 17.6 %
Другие поисковики проходящие как ссылки со страниц сайтов
http://www.bing.com/ 79 2.9 %
http://poisk.ru/ 5 0.1 %

Что это ошибка AwStat применяемой для обработки логов и вывода статистики или ошибки поисковых систем надо выяснять. Но последнее явно имеет место поскольку имеется некоторое количество роботов (см. таб. 1 - более 10%) которые не имеют идентификаторов поисковых систем или не могут быть идентифицированы.

Заключение

По данным статистики моего сайта безусловным лидером РУНЕТ является Яндекс. Я знаком с Яндексом с 2002 года, когда создал на нем на нем "народную" версию своего сайта. За это время периодически пользуюсь возможностями его поиска, примерно в равной мере с Nigma и Google.

Думаю, современные поисковые системы должны предоставлять интеллектуальный поиск подобный Nigma (российская интеллектуальная метапоисковая система, кластеризующая поисковая система), но для меня удобнее было бы применение тематической кластеризации. Поскольку применяемая система валит в одну кучу предложения продажи и документацию.

А Сорокин,

    Эта статья должна быть полностью переписана. На странице обсуждения могут быть пояснения. Поисковая система программно аппаратный комплекс с веб интерфейсом, предоставляющий возможност … Википедия

    Sphinx Тип поисковая система Разработчик Андрей Аксенов Написана на C++ Операционная система Кроссплатформенное программное обеспечение Последняя версия 2.0.6 release (22 октября 2012) Тестовая версия … Википедия

    Совокупность средств хранения, поиска и выдачи по запросу нужной информации. Поиск (размещение) информации в информационно поисковой системе осуществляется вручную или с помощью компьютера в соответствии с принятым информационным языком по… … Энциклопедия техники

    - (команда) при дрессировке собак. Апорт (поисковая система) российская поисковая система. Апорт (сорт яблок) алматинский сорт яблок. Апорт (операция) советская крупная военная операция по обнаружению стратегических подводных… … Википедия

    - (метапоисковая машина) это поисковая система, которая в отличие от классических поисковых машин не имеет собственной базы данных и собственного поискового индекса, а формирует поисковую выдачу за счет смешивания и переранжирования… … Википедия

    У этого термина существуют и другие значения, см. Наука (значения) … Википедия

    - «Ленгидропроект» проектно изыскательский институт, имеет организационно правовую форму открытого акционерного общества. Основной профиль деятельности проектирование, контроль строительства и обследование гидротехнических сооружений,… … Википедия

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

  • Апорт. История развития
  • Сайты, документы, сортировка
  • Заключение
  • Список сайтов

Апорт. История развития

Апорт - поисковая система русскоязычной части интернета.

Поисковая система Апорт на сегодняшний день (по статистике Openstat за декабрь 2011 года) находится на 16 месте по популярности поисковых машин Рунета. Данная система осуществляет полнотекстовый поиск документов c учетом морфологии русского языка в поисковых запросах.

Поисковая система Апорт впервые была презентована на пресс-конференции компании "Агама" в феврале 1996 года. Тогда система работала только по сайту russia. agama.com. К моменту официальной презентации, 11 ноября 1997 года, в поисковой системе Апорт был проиндексирован первый миллион документов, расположенных на 10 тысячах серверов. Отцом www.aport.ru стала компания "Агама" - разработчик программного обеспечения для Windows. Это отразилось и на создании поисковой системы, в отличие от большинства конкурентов Aport продолжает работать под управлением ОС Windows.

К важным свойствам первой версии поисковой системы Апорт можно отнести перевод запроса и ответа на английский язык и обратно. Второе свойство - реконструкция проиндексированных страниц из собственной базы. Это дает возможность просмотра уже несуществующих страниц.

Ноябрь 1998 года - Aport продан гражданину Израиля Джозефу Авчуку. Сумма сделки составила 55 тысяч долларов. Торговые марки "Апорт" и "Агама" сохранились, каталогу Ау! повезло гораздо меньше. В 1999 году Авчук окончательно покупает каталог и переименовывает его в AtRus, а после и вовсе уничтожает при экспорте на сайты "Омен", "Россия онлайн" и "Апорт".

Конец 1999 года - в поисковую систему Апорт вложен первый миллион долларов, это позволило, некоторое время спустя, представить на компьютерных выставках "Апорт - 2000". Полностью интегрированный с AtRus; теперь Каталог - Апорт (Catalog - Aport).

Поисковая система Aport 2000 была построена на основе выдачи результатов по отдельно взятым сайтам. Для разделения ресурсов на сайты Апорт использует информацию, которую предоставляет каталог AtRus, или владельцы ресурсов.

www.aport.ru - первым из поисковых систем Рунета реализовал базовые технологии Google. "Page rank" - характеристика популярности ресурса по формуле "обратных ссылок": ссылки с других сайтов на данный ресурс. Причем учитывается не только количество, но и важность ссылок. Вес ссылки с популярного сайта больше, а ссылки включающие слова запроса ценятся выше, чем ссылки со словом "здесь". К тому же, при обработке запроса поисковая система Aport 2000 ориентируется на HTML - код страницы, и наличие слов запроса в URL.

Еще одна особенность приоритет сайтам, вошедшим в высшую и элитную лиги Апорт - Каталог. В поисковой системе Aport впервые была реализована возможность поиска по новостным лентам.

Первым www.aport.ru стал использовать платную нулевую строку в выдаче. Но на Апорт купить не нулевое, просто более высокое место в ответной странице.

Масштабируемость в архитектуре Aport 2000 построена таким образом, что его поисковую базу можно дробить на несколько отдельных фрагментов, каждый из которых будет работать на своем компьютере. После поиска по фрагментам для пользователя рассчитывается общий ответ.

31 июля 2000 года Golden Telecom купил семейство интернет-проектов "Агама", включающее "Апорт" и AtRus, для включения в "Россию-онлайн" и околоконтентные проекты.

Май 2001 - года окончательно завершилась сделка по смене владельца "Апорт" самого "Golden Telecom", новым владельцем стал "Альфа-Банк". NASDAQ к тому времени переживал бурный спад, и шансов перепродать Интернет проекты за приемлемую сумму не было. Это обусловило решение новых хозяев "Golden Telecom" минимизировать расходы на поддержку дорогостоящих Интернет проектов.

История изменения алгоритмов работы

Апорт был создан под управлением операционной системы Windows. При создании поисковой системы Апорт были применены лингвистические разработки компании "Агама". При поиске учитывались морфология слов и выполнялась проверка орфографии запроса. В первой версии Апорта производился перевод запроса и результатов поиска на английский язык и обратно.

Обновленная система "Апорт 2000" была объединена с AtRus (сейчас Апорт. Каталог). Благодаря этому поисковая выдача осуществлялась по отдельно взятым сайтам. "Апорт 2000" первым из российских поисковиков реализовал технологии Google: расчет PR страницы в зависимости от количественного и качественного показателя внешних ссылок. Так же производился анализ страниц с учетом html тегов.

Введение платной нулевой строки, то есть самую высокую позицию в выдаче можно было купить. НА сегодняшний день поисковая система Апорт использует поисковые алгоритмы Яндекса.

"Апорт" предоставляет несколько видов поиска

Простой поиск

По умолчанию используется операторAND, т.е. релевантными считаются документы, содержащие все слова запроса.

Поддерживается поиск с помощью логических операторов AND (варианты: И, &, +),OR (ИЛИ, |),NOT (НЕ, -).

Круглые скобки задают порядок действия логических операторов.

Поддерживается поиск по фразе. Фраза заключается в кавычки.

Поддерживается поиск по начальной части ключевого слова с помощью символа "*", например: семиоти* = семиотика, семиотический.

Расширенный поиск

Тщательный поиск - поиск всех релевантных документов на сайте (обычно дается ссылка только на один) Сортировка по дате - ограничение по времени создания документов (дублирует специальный оператор "дата=") Искать - опции ниспадающего меню дублируют специальные операторы, позволяющие ограничивать поиск определенными разделами html-документа (title=, alt= и др.)

Выдача - задание формы выдачи результатов: полная или краткая (без описания сайта) Перевод выдачи - возможность вывода результатов поиска на английском или на русском языке Перевод запроса - возможность автоматического перевода запроса на русский или английский языки.

Популярные сервисы " Апорт "

В настоящее время возможности поисковой системы "Апорт" не так обширны, но все-таки значительны. На официальном сайте поисковика можно найти каталог, охватывающий добрую часть русскоязычных Интернет-ресурсов, с удобным рубрикатором и системой выдачи.

Также, на "Апорт" представлена актуальная информация различного рода: это и программа телевидения, и новости, и прогноз погоды, и котировки валют.

Особенности Апорт .

С момента добавления сайта в апорт до момента его появления в поисковой базе проходит от двух-трех дней до двух недель. В отдельных случаях, например, в случае нестабильной связи с добавленным сайтом, это время может оказаться несколько больше.

Апорт периодически проверяет уже имеющиеся в базе апорт сайты и приводит свою базу в соответствие с произошедшими там изменениями. Период проверки в значительной степени зависит от конкретного сайта (учитывается его популярность, динамичность обновления по данным собранным апортом при предыдущих заходах на сайт и ряд других факторов).

При просмотре содержимого сервера для индексирования апорт обязательно проверяет файл ROBOTS. TXT. Так что вы можете использовать его, чтобы ограничить "деятельность" апорта на своем сервере. При желании установить селективные ограничения только для апорта следует использовать в качестве имени робота слово Aport. Также поддерживаются мета теги Robots, позволяющие, в частности, установить правила поведения робота на вашем сайте даже в случае, если вы не имеете возможности изменять файл robots. txt на сервере. Апорт по умолчанию не индексирует документы, в Url которых встречается символ "?". Если вы считаете, что для вашего сайта такие документы следует индексировать, вы можете обратиться к апорт с подобной просьбой по email: [email protected]

Апорт индексирует все слова, которые бы увидел на экране человек, просматривая конкретную страницу вашего сервера. В результате любое слово из текста ваших документов может служить критерием последующего поиска. Для документов HTML кроме основного текста документа индексируются также: заголовок документа (TITLE), ключевые слова (META KEYWORDS), описания страниц (META DESCRIPTION) и подписи к картинкам (ALT). Кроме того, апорт индексирует как принадлежащие документу, тексты гиперссылок на этот документ с других страниц, находящихся, как внутри сайта, так и за его пределами, а также составленные (или проверенные) редакторами описания сайтов из каталога апорт.

Ключевые слова (META KEYWORDS) не имеют определяющего значения при определении релевантности документа Разумное использование этого тэга рекомендуется и может поднять ваш сайт в результатах поиска по соответствующим словам, однако, не следует думать, что именно на него апорт обращает внимание в первую очередь.

Апорт не применяет каких-либо специальных санкций к сайтам, пытающимся обманутьпоисковую систему апорт с помощью спама, однако добиться подобным способом желаемого результата не получится. Поэтому не стоит писать невидимые тексты, вбивать сотни ключевых слов, не имеющих никакого отношения к содержанию документа и т.д. Помните, что во многих поисковых системах предусмотрены жесткие меры для борьбы со спамом, включая полное удаление сайта из системы.

Вот перечень основных критериев, которые учитывает поисковая система апорт при сортировке сайтов:

1. поисковая система апорт учитывает количество искомых слов в тексте документа (в процентах) расстояние между поисковыми словами в тексте документа

2. поисковая система апорт учитывает место в тексте, где встречаются поисковые слова (заголовок, описание, мета-таг и т.п.)

3. поисковая система апорт учитывает внешний вид шрифта, которым набраны в тексте искомые слова (размер, жирность, цвет)

4. поисковая система апорт учитывает количество ссылок из Интернета на данный документ

5. поисковая система апорт учитывает использование искомого слова в тексте ссылок из Интернета на данный документ

Окончательный процент соответствия документа запросу строится как некая функция от всех этих показателей. Часть из них просты и понятны (хотя учитываются далеко не всеми поисковыми машинами), часть требует пояснения, поскольку это новые, практически уникальные решения.

Сайты, документы, сортировка

Сайты.

Многие поисковые системы сегодня, так или иначе, оперируют понятием сайта, но подразумевают под этим просто адрес сервера типа www.server.com. В этом случае адрес сайта определяется из адреса страницы простым отрезанием хвоста: из http://www.server.com/users/~vasya получается сайт www.server.com. Для больших серверов, где размещены сайты множества фирм или людей, это неудачное решение. Апорт берет в качестве сайта сервер только в самом крайнем случае. Как правило, для определения того, какая группа страниц является логическим целым (сайтом), Апорт использует информацию из базы данных своего каталога, информация о сайтах в котором вводится человеком, а потому гораздо точнее, чем то, что дает любой автоматический алгоритм (специальные алгоритмы тоже используются, но только, если сайт не зарегистрирован в каталоге).

Документы.

Апорт дает весьма информативное представление найденных при поиске страниц. В блоке каждого сайта Апорт приводит информацию об одной из наиболее релевантных найденных на сайте страниц: адрес, заголовок, дата и цитата из документа. Важно, что цитаты выбираются из полного текста документа и содержат слова запроса.

Также имеется ссылка на реконструкцию полного текста документа. Она нужна, если документ недоступен на самом сайте (упал сервер, документ уже удалили и т.п.) Если нужно получить информацию о всех остальных страницах, которые Апорт нашел на сайте, то можно воспользоваться ссылкой, которая замыкает блок результатов. По этой ссылке выдается дополнительное окно, в котором отображаются результаты поиска только по данному сайту. Они состоят из блоков, данных по отдельным страницам.

Сортировка

Общие принципы Задача ранжирования результатов поиска является определяющей с точки зрения качества работы поисковой системы. Разработка хорошей функции ранжирования весьма непростая задача, в частности, из-за большой неоднородности ранжируемых документов и из-за попыток сознательного искажения результатов поиска с помощью поискового спама. Мощным средством повышения качества ранжирования является учет гипертекстовой структуры Интернета: ссылочное ранжирование и индекс цитируемости позволяют (хотя и не всегда) отличить качественный контент от сходного по содержанию "мусора”, а также (что особенно важно для владельцев сайтов) оригинальные материалы от их копий. Однако и здесь приходится иметь дело с теми же проблемами: неоднородностью ссылочной структуры и ее сознательным искажением спамерами.

Ещё одним важным средством повышения релевантности является использование информации из каталога Апорта, которая обладает высокой степенью достоверности, так как составлена или проверена профессионально подготовленными редакторами.

Принципиальным моментом в ранжировании результатов поиска в Апорте является стремление к учёту максимального количества критериев ранжирования в их взаимосвязи. В частности, заметное преимущество получают документы, имеющие высокий вес сразу по нескольким независимым критериям (например, по частотности слов запроса в тексте и ссылочному ранжированию).

Ранжирование производится исключительно автоматическими методами, мы не осуществляем специальной корректировки результатов поиска для каких-либо запросов или сайтов.

Критерии ранжирования Апорт применяет следующие критерии при ранжировании документов:

* частота и взаимное расположение слов запроса в тексте документа;

* размер документа;

* присутствие и взаимное расположение слов запроса в выделенном (размером шрифта или html-тегами , ,

.

) тексте;

* присутствие и расположение слов запроса в заголовке документа;

* присутствие и расположение слов запроса в мета-тегах "keywords" и "description";

* присутствие и расположение слов запроса в ссылках на ранжируемый документ и авторитетность этих ссылок;

* присутствие и взаимное расположение слов запроса в названии и описании сайта в каталоге Апорта (учитывается при вычислении веса главной страницы сайта);

* взвешенный индекс цитирования документа;

* количество страниц сайта, имеющих высокую релевантность запросу.

Результирующий вес документа рассчитывается по специальному алгоритму, различным образом учитывающему сочетания разных критериев.

Частотные характеристики. Учитывается как абсолютная, так и относительная частота слова в тексте документа.

И для той и для другой величины существуют пороговые значения, после достижения, которых дальнейшее увеличение частоты не влияет на вес документа. Для небольших документов, размер которых (в словах) меньше заданной константы, относительная частота рассчитывается не от их фактического размера, а от этой константы.

В заголовке, мета-тегах, а также в названии и описании сайта из каталога частота слов не учитывается.

Ссылочное ранжирование Алгоритмы ссылочного ранжирования в Апорте учитывают не более одной ссылки с каждого домена второго уровня для отдельного запроса (то есть, для разных запросов могут учитываться разные ссылки).

Вес каждой ссылки зависит (помимо ее текста) от взвешенного индекса цитирования ссылающейся страницы.

Взвешенный индекс цитирования Алгоритм вычисления взвешенного индекса цитируемости является модификацией классического алгоритма PageRank. В качестве одной из наиболее существенных особенностей следует отметить, что учитывается не более одной ссылки на документ с каждого домена второго уровня.

Индексом цитирования сайта считается взвешенный индекс цитирования страницы, самый высокий среди всех страниц сайта (в большинстве случаев это бывает взвешенный индекс цитирования главной страницы сайта).

Мета-теги "keywords" и description" Ключевые слова (meta keywords) учитываются Апортом даже в случае их отсутствия в тексте документа. Индексируется не более 16 ключевых слов для каждого документа. Мета-тег description также учитывается при ранжировании, однако, в большинстве случаев, имеет очень небольшой вес.

Поиск информации с помощью системы Апорт

Для поиска информации в данной системе можно воспользоваться специальными операторами:

операторы расстояния

" - кавычки позволяют находить словосочетание, указанное в них, или близкое к нему. Пример: по запросу "яблоки на снегу" будут найдены документы, содержащие следующие фрагменты: "яблоки на снегу", "яблоки и снег", "яблокам под снегом", "яблоко снег" и т.п.

сл2 (.) - Данный оператор позволяет ограничить расстояния в словах (двойка указана как пример). Если вы хотите потребовать, чтобы заданные вами слова встречались, скажем, в пределах 5 слов, то надо написать: сл5 (университет студент зачет). При этом будут найдены документы, где между словами "университет", "студент" и "зачет" стоит не более двух других слов (то есть общее число слов во фрагменте не более 5).

логические операторы

и - оператор И подразумевает, что его можно опускать: запрос поисковая система полностью эквивалентен запросу поисковая И система. И в первом и во втором случае будут найдены документы, содержащие оба слова.

или - данный оператор позволяет искать документы, содержащие хотя бы одно из заданных в поиске слов. По запросу поисковая ИЛИ система будут найдены документы, содержащие любое из указанных слов или оба слова одновременно.

не - оператор логическое НЕ ограничивает поиск документами, не содержащими слово, указанное после оператора. По запросу звери НЕ группа будут найдены документы, содержащие слово "звери", но не содержащие слово "группа".

() - с помощью этого оператора, по запросу быстрая ИЛИ качественная покраска будут выданы документы, содержащие либо слово "быстрая", либо одновременно слова "качественная" и "покраска". По запросу (быстрая ИЛИ качественная) покраска будут выданы документы, где встречаются одновременно слова "быстрая" "покраска", либо "качественная" и "покраска".

операторы позволяющие искать по адресам

url= - данный оператор позволяет получить список документов, проиндексированных поисковой системой на заданном сайте. Например, по запросу url=www.diary.ru будут выданы все документы, найденные на сайте www.diary.ru. операторы, осуществляющие поиск по определенным полям

title= - указанное после равенства слово или словосочетания в круглых скобках будут искаться в заголовках документов. По запросу title= (фрукты или овощи) будут найдены документы, содержащие в заголовке слово фрукты или слово овощи, или оба слова одновременно.

keywords= - указанное после равенства слово или словосочетания в круглых скобках должны искаться в поле META KEYWORDS документов. По запросу keywords (фрукты и овощи) будут найдены документы, для которых автор в ключевых словах указал оба слова: фрукты и овощи.

alt= - указанное после равенства слово или словосочетания в круглых скобках должны искаться в полях ALT (комментарии к картинкам). По запросу alt (Дмитрий Медведев) будут найдены документы, в которых есть картинка с комментарием, содержащим как минимум два слова: Дмитрий и Медведев.

anchor= - указанное после равенства слово или словосочетания в круглых скобках должны искаться в тексте ссылок. По запросу anchor (ненавижу эмо) будут найдены документы, в тексте ссылок на которые, встречаются оба слова: ненавидеть и эмо.

поисковая система апорт интернет

Заключение

В настоящее время возможности поисковой системы "Апорт" не так обширны, но все-таки значительны. На официальном сайте поисковика можно найти каталог, охватывающий добрую часть русскоязычных Интернет-ресурсов, с удобным рубрикатором и системой выдачи. Также, на "Апорт" представлена актуальная информация различного рода: это и программа телевидения, и новости, и прогноз погоды, и котировки валют.

Особый блок сервисов поисковика составляют почта, справочная информация (в разделе "Словари") и поиск объекта по адресу (для Москвы, Санкт-Петербурга, а также для федеральных округов РФ: Дальневосточного, Приволжского, Северо-Западного, Сибирского, Уральского, Центрального и Южного).

С помощью "Доски объявлений" от "Апорт" можно приобрести, продать, подарить или принять в дар все, что угодно: от котят до земельных участков. Данный сервис предлагает еще и поиск работы, однако найти здесь настоящие вакансии среди сомнительных объявлений довольно сложно.

Список сайтов

1. http://seopult.ru/library/%D0%90%D0%BF%D0%BE%D1%80%D1%82

2. http://www.seoexp.com/ru/history/aport_history/full_article

3. http://www.nlr.ru/res/inv/ic_old/aport. htm

4. http://www.wmz-portal.ru/page-al-poiskovaja_sistema_aport.html

5. http://www.electrosad.ru/RedCol/Internetfind. htm

6. http://www.wmz-portal.ru/page-al-poiskovaja_sistema_aport.html

7. http://www.prof-lead.ru/poiskovaya-sistema-aport/

8. http://earnon.ru/aport. php

Размещено на Allbest.ru

...

Подобные документы

    Определение программного и математического обеспечения ИС. Виды запросов к базам данных в СУБД. Поисковые системы Интернет. Описание принципа работы поисковых систем Яндекс, Рамблер, Апорт. Особенности пересылки файлов средствами электронной почты.

    контрольная работа , добавлен 22.11.2009

    Обеспечение высокой релевантности поиска с помощью поисковой системы Google. Быстрота и надежность работы, большее количество ссылок в русскоязычном секторе Интернета. Службы, отсутствующие у других поисковых систем. Google как законодатель моды.

    презентация , добавлен 10.03.2015

    Понятие информационно-поисковых систем, их сущность и особенности, история возникновения и развития, роль на современном этапе. Внутреннее устройство и элементы поисковой системы. Принцип работы поисковой машины Рамблер, прядок обработки запроса.

    научная работа , добавлен 29.01.2009

    Понятие и принципы работы, внутренняя структура и элементы, история формирования и развития поисковой системы "Rambler". Исследование и анализ, а также оценка эффективности данной поисковой системы для поиска экономической информации в интернете.

    курсовая работа , добавлен 10.05.2015

    Алгоритмы и алфавит языка Турбо Паскаль. Основные типы данных. Операторы присваивания, перехода и выбора. Понятие массива в Паскале. Особенности работы со строками в программе. Использование линейного поиска и поиска с барьером. Основные виды сортировок.

    учебное пособие , добавлен 09.11.2009

    Анализ существующих поисковых систем и используемых ими алгоритмов поиска документов. Разработка информационно-поисковой системы словарного типа, способной осуществлять релевантный поиск документов, особенности ее структуры и информационно-поисковой базы.

    дипломная работа , добавлен 19.05.2011

    История развития поисковых систем, особенности механизма поиска. Сравнительный обзор справочно-поисковых систем Интернета. Понятие поисковых роботов. Наиболее популярные поисковики для русскоязычного пользователя. Перспективы развития поисковых систем.

    реферат , добавлен 20.12.2012

    Основные методы объектно-ориентированного программирования поисковой системы. Выбор языка программирования и среды разработки приложения. Реализация паттерна, использование принципа сохраняемости. Описание пользовательского интерфейса поисковой системы.

    курсовая работа , добавлен 29.04.2015

    Понятие и классификация поисковых систем, история их развития и структурные элементы. Характеристика существующих моделей поиска, анализ его качества. Особенности обработки запроса поисковой системой, подготовки базы данных и процесса выдачи результатов.

    курсовая работа , добавлен 15.04.2014

    Рассмотрение принципов поисковой системы и процедуры проведения поиска по запросам пользователей "Яндекса". Изучение структуры запросов, вспомогательных программ поиска, модулей и этапов их преобразования. Описание дополнительной информации в сниппете.

Апорт (aport.ru) – русскоязычный портал, с помощью которого пользователи могут сравнивать цены на различные товары и услуги на российском рынке. На сайте присутствует удобный механизм сортировки объектов по категориям, производителям, ценам, а также по городам, где данный товар присутствует в наличии. Спрашивая, что такое апорт, чаще всего подразумевается поисковая система, коей портал aport.ru и являлся до некоторого времени.

История

Представлен сервис был впервые в 1996 году, а радиус поиска был ограничен всего лишь одним порталом. Однако рождение Апорта как поисковой системы произошло в 1997 году, и тогда она могла индексировать уже весь российский сегмент интернета. Система содержала в себе такие разделы, как:

  • Апорт.Каталог.
  • Апорт.Погода.
  • Апорт.Телепрограмма.
  • Апорт.Недвижимость.
  • Апорт.Словари и другие.

До 2000х годов Апорт был одним из лидеров среди поисковых сервисов, до тех пор, пока его не выкупили и не прекратили разработку. Со временем система сдавала свои позиции – на первые места вышли Рамблер и Яндекс, а наработки из Апорта потом использовались при создании других поисковых машин. Вскоре и сам Апорт стал использовать в своей работе более совершенные алгоритмы Яндекса, пока в 2012 году вновь не был выкуплен другой компанией и не перепрофилирован в электронный каталог товаров.

Середина 90-х годов — это расцвет и золотая эра русских поисковых систем. На волне популярности новых технологий системы индексации интернета они начали появляться как грибы после дождя. Во многом благодаря возникшей тогда конкуренции Рунет может похвастаться одним из самых лучших поисковиков на планете — Яндексом.

В 1996 году компания Агама разработала и выпустила поисковый движок Апорт, который к следующему году стал полноценной поисковой системой, работавшей со всем Рунетом. К концу 90-х годов Апорт стал одним из лидеров рынка, прямо конкурируя с Яндексом, Рамблером и Mail.ru.

Интерфейс Апорт в 1997 году

К 2000-му году Апорт успевает поменять своего владельца дважды. Годом ранее поисковая система была куплена инвестором из Израиля, который меньше чем через год сумел продать ее в 500 раз дороже компании Golden Telecom. В то время интернет-компании переживали стремительный рост и выходили на сверх прибыли, поэтому деньги особо никто не считал и вкладывались они в разные активы, в том числе и в такие, которыми не умели толком распоряжаться. Так получилось и с Апорт, разработка и расширение которого были приостановлены. Несмотря на постоянные смены дизайна и мелкие добавления в виде виджета курса валют на главной странице и виджетов погоды, алгоритмы поисковой системы не развивались.

Интерфейс Апорт в 2000 году

Но это не мешало росту популярности ресурса, к 2005 году поисковая система достигла пика своего развития. Сайт посещали ежедневно 25 миллионов человек, что для периода развития интернета десятилетней давности просто поражающие воображения цифры. Именно на пике популярности Golden Telecom продал поисковик компании Вымпелком, которая отбивала лишь затраченные деньги и не занималась развитием проекта.

Интерфейс Апорт в 2005 году на пике популярности

Но все же, чтобы быть впереди, нужно постоянно развиваться, а развитие Апорт сводилось к смене дизайна чуть ли не каждый год. Как следствие: неизбежная потеря конкурентоспособности и потеря популярности среди пользователей Рунета. 2010-2011 года можно характеризовать, как полный закат Апорта как поисковика, когда владельцы компании отказываются от собственных устаревших алгоритмов поиска и переходят на поиск от Яндекс.

В 2012 году Апорт был выкуплен Андреем Бронецким, генеральным директором портала Mamba.ru за 150 тысяч долларов. Почти сразу же после этого портал, потерявший практически весь ежедневный трафик, был перепрофилирован в прайс-агрегатор. Сегодня это аналог ЯндексМаркета, но со значительно более низким количеством ежедневных посетителей.

Апорт сегодня

Как видите, гонка за прибылью, непонимание важности постоянного развития и неумелое управление привели к тому, что один из самых перспективных поисковиков русскоязычного интернета пришел в полный упадок, а потом и вовсе перестал существовать как самостоятельная поисковая машина. Сегодня сайт aport.ru посещает несколько десятков человек в день, что невозможно даже близко сравнить с его пиковой посещаемостью в середине 2000-х годов. Чтобы проследить взлет и падение поисковика, достаточно обратить внимание на денежные суммы, которые выплачивали новые владельцы предыдущим.

В 1999 году Апорт был куплен израильским инвестором за 55 тысяч долларов.

В 2000 году куплен компанией Golden Telecom за 25 млн долларов.

В 2006 году куплен компанией Вымплеком за 10 млн долларов.

В 2012 году куплен Андреем Бронецким за 150 тысяч долларов.