Rambler's Top100 Service

  Radius Group
СКАЧАЙТЕ БЕСПЛАТНО

ПУТЕВОДИТЕЛЬ

по всем нашим сайтам. Уникальная программа


РАЗДЕЛЫ ПОРТАЛА
  Главная страница
Бесплатная документация
Форумы
ГОРЯЧАЯ НОВОСТЬ
 

23 Mar (00:01)
Поиск в Google
Простые рекомендации от SecurityFocus

Архив...
ЛАБОРАТОРИЯ
  Место где решаются Ваши проблемы

Сейчас в Лаборатории
Компаний: 1656
Экспертов: 693

Вход
для пользователей
для экспертов

Как работает Лаборатория?
НОВОСТИ КОМПАНИЙ
 

9 Feb (00:04)
Кто боится Liebert UPStation?


15 Dec (00:04)
Система Online-control.net - три года успешной работы!

26 May (18:12)
Семинар "Создание эффективных веб-сайтов"

29 Apr (00:08)
Интернет-сайт компании: удобное средство для заработка денег или дополнительные накладные расходы?

15 Apr (00:26)
Три источника, три составные части Intel Centrino

Архив...
СТАТЬИ И ОБЗОРЫ
 

Октябрьские исправления Microsoft влияют на браузер IE
Статья

Microsoft торопится с Longhorn и удаляет WinFS

Windows XP SP2 Released to Manufacturing

Потрошим файлы PDF

Компьютерные законы Мерфи

Архив...
Назад НаверхВниз
Советуют профессионалы! Совет: Перекрестные ссылки между свежими и архивными материалами, во-первых, помогут читателю получить знания, во-вторых, значительно повысят ценность архива.

.
NEWS.ITUNION.RU НазадНаверхВниз

О Google и поисковых системах в целом


После запрещения правительством Китая доступа своих граждан к поисковой системе Google компания выпустила (см. www.theregister.co.uk/content/6/26936.html ) краткое заявление: "Мы работаем с официальными представителями Китая, чтобы восстановить доступ к нашей системе миллионам китайцев, ежедневно использующим Google". Причиной запрета на доступ была возможность получения через эту систему "порнографии и антиправительственных публикаций". Однако у Google, как впрочем и у других поисковых систем, существуют не только политические, но и технические (лучше сказать теоретические) проблемы.

В публикации Salon (см. www.salon.com/tech/feature/2002/08/29/google_watch/index1.html ) рассказано об одной характерной проблеме. Некий Дэниел Брандт (Daniel Brandt) поддерживает собственную систему поиска NameBase - интерактивную базу данных для хранения цитат и публикаций об известных политиках и других "публичных" людях. В настоящее время в NameBase собраны более 200 тыс. цитат о 100 тыс. человек. Брандт весьма недоволен индексацией собранной информации в поисковике Google. Если с использование этой системой файлов cookie еще можно согласится, то система ранжирования результатов поиска PageRank (по крайней мере, по мнению Брандта) является главным недостатком Google.

PageRank - это основа Google, заложенная еще в студенческие времена основателями компании Ларри Пейджем (Larry Page) и Sergey Brin (Сергеем Брином). Смысл алгоритма PageRank в следующем: "Google рассматривает ссылку из страницы A на страницу B как голос, поданный страницей A в пользу страницы B. Причем Google не только анализирует суммарное количество голосов и число ссылок на страницу, но и важность (приоритет) голосующей страницы. Голос, поданный важной страницей, имеет больший вес, чем голос, поданный менее важной страницей".

В случае с NameBase это приводит к такому результату: поиск по фразе "NameBase" дает в верхней части списка результатов сайт Брандта, но поиск по именам людей из этой базы данных перемещает сайт Брандта в отдаленный конец списка. Кстати, важность (приоритет) любой страницы можно увидеть в окне Google Meter из состава Google Toolbar. Ранжированием в том или ином виде пользуются все поисковые системы (хотя и не объявляют об этом, кстати и Google с некоторых пор не упоминает в рекламных материалах о PageRank). Недостатки ранжирования очевидны: сайты подстраиваются по алгоритм, чтобы попасть на вершину списка результатов (этим грешим и мы - news.itunion.ru - ведь в название этой страницы добавляется название последней из опубликованных новостей), большие корпоративные сайты с множеством ссылок всегда становятся важнее сайтов, критикующих эти компании (где же демократия?), ненужное увеличение внутренних ссылок повышает важность сайта, возможна торговля значением важности страниц (как поисковиками, так и владельцами важных сайтов) и т.д.

В заключение хотим предложить несколько рекомендаций:

1. Для получения полного набора результатов используйте несколько разных поисковых систем. Полученные списки не являются окончательными - это скорее "ниточки", ведущие к действительно полезным данным.

2. Для поиска на крупных сайтах (например, информации о принтере на hp.com) лучше использовать собственные средства поиска этого сайта.

3. Чем "глубже" находится страница в сайте (т.е. чем дальше она от домашней страницы), тем меньше шансов попасть в результаты поиска. Дополнение: загляните в архивы новостей и публикаций ITUnion - там много интересной информации, которую мы не дублируем в текущих выпусках новостей.

Полная лента новостей NEWS.ITUNION.RU

Вы можете подписаться на ежедневную
бесплатную рассылку IT-новостей:
Email
 

....
  Site DESIGN by MIRRON (C) 2000-2001 Rambler's TOP100