Russian Frisco - Русский Сан Франциско
Русские концерты на Американской сцене
. Russian America Top
Russian Frisco News. Новости на Русском Сан ФранцискоNews Russian Frisco - Events. События и Афиша на Русском Сан ФранцискоEvents Russian Frisco Yellow Pages. Жёлтые страницы Русского Сан ФранцискоYellow Pages Russian Frisco Classfieds. Объявления на Русском Сан ФранцискоClassifieds Russian Frisco Dating. Знакомства на Русском Сан ФранцискоDating Russian Frisco Forum. Дискуссионный клуб Русского Сан ФранцискоForum Russian Frisco Chat. Чат на Русском Сан ФранцискоChat
 News Central
В мире
  Политика
  Разное
Бизнес
  Деньги
Общество
  Мода
  Религия
  Светская жизнь
  Шоу Бизнес
  Пикантные новости
  Животные
  Криминал
Спорт
Искусство
  Кино
  Музыка
Авто
Hi-Tech
  Интернет
  Hardware
  SoftNews
Здоровье
Путешествия
Вокруг света
USA
Россия
  
Ресурсы
  Самые последние
  Самые читаемые
Архив
 Другие ресурсы
Все Ресурсы

Рассылки
Газеты
Журналы
ТВ - Online
Радио

Юмор
  Анекдоты
  Игры
  Этикетки
  
Открытки
  Поздравь друга
  
Программа TV
Кино
  Новости кино
  Кинообзоры
  
Музыка
  Радио в internet
  Russian Top
  
Спорт
Web Обзоры Exler.ru
  
Читальный зал
ЭКСпромт - статьи для чайников
Компьютерные игры
Finance News
Автообзоры
Russian America Journal Digest
 Смотрите также
Yellow Pages
Объявления
Чат
Форум
  последнее

Читальный зал
  Стихи
  Проза
  Кулинария

Едем в Америку!
  Иммиграция
  Визы
  Советы

Знакомства
Фотоальбомы
Top Rating
  America TOP
  
 
NEWS CENTRAL >> Hi-Tech >> Интернет

Интернет

От спама спасет теория вероятности
2:10AM Thursday, Oct 3, 2002
Непрошенные рекламные рассылки по электронной почте являются одной из наиболее серьезных проблем интернета. На их чтение и удаление тратится большое количество рабочего времени, а существующие на сегодняшний день фильтры не отличаются совершенством. Однако работа по совершенствованию спам-фильтров продолжается. Американский программист и предприниматель Пол Грэм опубликовал в интернете статью, подробно описывающую эффективный метод борьбы с рекламными письмами. Этот метод основывается на теории вероятности и использует для фильтрации спама алгоритм Бейеса. В настоящее время большинство фильтров относят письмо к спаму на основании наличия у него определенного набора признаков. Это могут быть слова или их сочетания, целые предложения или тэги HTML. Такие методы могут оказаться весьма эффективными. Например, созданный Грэмом простой фильтр смог обнаружить 79,7% спама, и лишь в 1,2% случаев к спаму были отнесены обычные письма.

Однако усовершенствование этой системы оказалось более сложной задачей. Грэм посвятил ее решению более полугода, пока ему не пришло в голову использовать для фильтрации спама статистические алгоритмы. В разработанном Грэмом прототипе фильтра каждому встречающемуся в электронной переписке слову или тэгу присваивается значение вероятности его наличия в спаме. На основе этих вероятностей с помощью алгоритма Бейеса вычисляется вероятность того, что данное письмо является спамом.

Высокая вероятность присваивается как излюбленным спамерами словам, вроде sexy или promotion, так и таким неожиданным, на первый взгляд, сочетаниям как ff0000 - код ярко-красного цвета в HTML. Соответственно, низкая вероятность соответствует профессиональным терминам или просто редко использующимся в рекламе словам вроде standardization или mandatory.

В процессе испытания системы фильтрации спама Грэм пропустил через нее 8000 писем, половина из которых являлась спамом. В результате, через фильтры смогли просочиться лишь 0,5% рекламных сообщений, а количество ошибочных срабатываний фильтра на основе бейесовского подхода оказалось нулевым, передает Компьюлента.

По мнению Грэма, для того чтобы система была действительно эффективной, она должна поддерживать возможность индивидуальной настройки, поскольку терминология, использующаяся в электронной переписке разными людьми, отличается. Если же пользователь будет регулярно помечать рекламные письма как спам, то программа сможет накопить достаточно информации для эффективной фильтрации электронной почты.

Грэм разработал вариант своего фильтра на созданном им самим языке Arc (вариант LISP). В свою очередь, группа энтузиастов в настоящее время работает над проектом spambayes. Его целью является разработка спам-фильтра на основе бейесовского алгоритма и языка Python.

Корреспондент.net
« « Вернуться       Далее » »
Другие новости по теме
  • Оператор домена .NU предлагает клиентам бесплатное ПО для создания веб-логов
  • Принципиально новая пиринговая сеть, лишенная недостатков KaZaA и Gnutella
  • Новые поисковые устройства Google
  • Мультимедийная реклама на портале Yahoo

    Далее » »   Digest | Архив »    
Смотрите также: Hi-Tech, Hardware, SoftNews
 
Читайте также:

Хакеры вышли за пределы интернета и атакуют видеоконференции

Поисковик Google отправляет Microsoft ''ко всем чертям''

Секретные разработки Motorola просочились в интернет


Новая опасность: интернет атакован

Количество рекламы в электронной почте будет увеличиваться

Изобретен новый способ борьбы с порнографией в интернете

Из Napster сделают крупнейший пункт обмена порнографией в интернете

Домен .ORG в ожидании вердикта



Рассылки:
  Новости-почтой
  TV-Программа
  Гороскопы
  Job Offers
  Концерты
  Coupons
  Discounts
  Иммиграция
  Business News
  Анекдоты
Многое другое...

News Central Home | News Central Resources | Portal News Resources | Help | Login
 
Russian Boston Russian LA Holostyak.com Рейтинг@Mail.ru © 2025 RussianAMERICA Holding
All Rights Reserved • Contact