19.03.2003

«Рамблер» утер нос «Яндексу»

Начиная с марта 2003 года поисковая машина компании «Рамблер» начала обрабатывать страницы, созданные с использованием технологии Macromedia Flash. По прогнозам специалистов компании, новая разработка позволит не только ускорить обработку таких страниц, но и пополнит базу новой, ранее неизвестной поисковой машине информацией. «Рамблер» стал первой поисковой системой Рунета, «научившейся» понимать строение flash-контента.

Новая разработка компании позволяет извлекать гиперссылки из flash-объектов и использовать их наравне со ссылками, полученными из обычных html-страниц. При этом сами flash-объекты пока не индексируются. Такое решение было принято потому, что большая часть flash-объектов содержит элементы навигации, заставки, меню и другие фрагменты, очень важные в качестве источника гиперссылок, но малоинформативные как текст.

Как сообщается в пресс-релизе «Рамблера», при тестировании новой технологии поисковая машина обработала 50 тыс flash-страниц, из которых было извлечено около 100 тыс уникальных гиперссылок. Это позволило «Рамблеру» пополнить свою поисковую базу 35 тыс новыми ссылками, ранее неизвестными роботу поисковой машины.

«Конечно, некоторая часть из этих страниц была бы со временем найдена другими путями. Однако благодаря разработке компании теперь это будет происходить значительно быстрее, а web-мастера будут избавлены от необходимости дублировать гиперссылки flash-объектов на дополнительных html-страницах», — говорят разработчики поисковой системы.

Надо сказать, что на западе первой поисковой системой, научившейся «понимать» flash-файлы, стала AllTheWeb, разработанная в недрах компании Fast Search & Transfer ASA. Тогда новшество механизма норвежской поисковой системы автоматически стало доступным всем партнерам Fast Search, среди которых Lycos, Tiscali, InfoSpace и T-Online.

«Я бы не стал рассматривать запуск этой технологии как серьезный прорыв, — говорит Сергей Петренко, владелец интернет-проекта SearchEngines.Ru. — Во-первых, в Сети не так уж много уникальной информации, недоступной иначе, кроме как по ссылкам во Flash. Во-вторых, большинство сайтов, выполненных с использованием этой технологии, снабжены дублирующей навигацией в обычном html. Да и что такое для „Рамблера“ 35 тыс страниц? Запуск индексации flash-контента, скорее, более ценно как показатель развития поисковой системы „Рамблера“. И это уже интересно».

Источник: WEBPLANET.RU