Jak vyměnit motorový olej a olejový filtr na Mercedes Vito ...
Antispamový filtr
-
Upload
madeleine-bertrand -
Category
Documents
-
view
21 -
download
1
description
Transcript of Antispamový filtr
Antispamový filtrPetr Čech
Petr Čech: Antispamový filtr 2
Nevyžádaná pošta
Elektronická pošta: Nízké provozní náklady a možnost téměř
okamžitého doručení:▪ Elektronická pošta je ideální nástroj předávání
nevyžádaných informací.▪ Tak zvaná nevyžádaná pošta.
Nevyžádaná pošta dnes tvoří více jak 60 % všech přenášených zpráv.
Petr Čech: Antispamový filtr 3
Nevyžádaná pošta
Problémy: Snížení pracovních výkonů – nutnost
třídit poštu Zvýšení zatížení poštovních serverů Zvýšení provozních nákladů Zhoršení výhodných vlastností
elektronické pošty jako služby …to vše vyžaduje nalezení nějakého
řešení
Petr Čech: Antispamový filtr 4
Jak se bránit?
Legislativní opatření: Na vládní úrovni definované právní normy
(neefektivní) Obchodní opatření:
zpoplatněním elektronické pošty nějakou minimální částkou (efektivní ale nepopulární)
Chování uživatelů: správným chováním v prostředí internetu
můžeme množství přijatých nevyžádaných správ výrazně snížit
Technická opatření
Petr Čech: Antispamový filtr 5
Technická opatření
Naivní metody – Černé listiny Na internetu existuje několik tzv.
černých listin odesilatelů Při příchodu každého dopisu je zaslán
dotaz, zda stroj, od kterého je zpráva přijímána, nemá záznam v některé černé listině
V kladném případě je taková pošta odmítnuta
Např. projekt MAPS (Mail Abuse Prevention System)
Petr Čech: Antispamový filtr 6
Technická opatření
Metody identifikace nevyžádané pošty bez analýzy obsahu zpráv Rozpoznání podezřelé zprávy, aniž by bylo třeba
analyzovat obsah Např. metoda Greylisting:▪ Poštovní server při neúspěšném doručení zařadí zprávu do fronty
a po určitém čase se ji pokusí doručit znovu (oproti tomu rozesílače nevyžádané pošty zprávy rozesílají jednorázově).
▪ Přijímací server si z každého dopisu zjistí IP adresu odesílajícího stroje, adresu odesilatele a adresu příjemce.
▪ V případě, že tuto trojici IP adres již nalezne ve své databázi, zprávu normálně do ručí.
▪ V opačném případě dopis odmítne, informuje o tom odesílající server a novou trojici si zapíše do databáze s příznakem, že po předem určenou dobu nebude dopisy se shodnými parametry přijímat.
Petr Čech: Antispamový filtr 7
Technická opatření
Identifikace nevyžádané zprávy na základě analýzy obsahu zpráv Na základě výskytu určitých slov, nebo frází. Dokonalejší metody využívají heuristické
postupy a snaží se “učit“ na základě předkládaných příkladů.
Spolehlivost:▪ u nejlepších kolem 60 – 70%▪ Při určení spolehlivosti je důležitá nejen schopnost
rozpoznat nevyžádanou poštu, ale také počet tzv. “falešných poplachů“, kdy program mezi spam zařadí legitimní zprávu.
Petr Čech: Antispamový filtr 8
Analýza obsahu zprávy
elektronická adresa odesilatele předmět emailové zprávy tělo elektronické zprávy:
čistě textový obsah (plain text) webový obsah (html kód) Názvy souborů▪ Obrázky uvnitř webového obsahu▪ Přílohy
Petr Čech: Antispamový filtr 9
Triky spamerů
nepoužívání klíčových slov častá změna adresy odesilatele nepoužívání nestandardních příznaků (již se
neobjevují zprávy nevyžádané pošty např. s vysokou prioritou)
obsah zprávy již nemá čistě textový charakter
multimédia maskování (text, který má spamerský
charakter je maskován jiným textem) textové triky
Petr Čech: Antispamový filtr 10
Textové triky – Oddělování znaků
jednotlivé znaky, ze kterých se klíčové slovo skládá, lze oddělovat nějakým jiným znakem: v.i.a.g.r.a, v_i_a_g_r_a, v-i-a-g-r-a, …
Petr Čech: Antispamový filtr 11
Textové triky – Nahrazování znaků
nahrazování abecedních znaků znakem jiným, který je opticky velmi podobný, různá slova tak lze například zapsat: v1agra (viagra) \ / iagr@ (viagra) w4tch (watch) ord3r (order) …
Petr Čech: Antispamový filtr 12
Textové triky – násobení znaků
Již klasickým trikem se také stalo znásobení některého znaku v klíčovém slově: viiiagra (viagra) ooorder (order) …
Petr Čech: Antispamový filtr 13
Textové triky – prohazování znaků
některé znaky v klíčovém slově lze snadno prohodit, pro počítačový program je pak text obtížné čitelný, pro člověka ale nikoliv: vaigra vigara Viagar …
Petr Čech: Antispamový filtr 14
Textové triky – rozdělování slov
autor nevyžádané zprávy záměrně rozdělí klíčové slovo nahodilým vkládáním mezer, například slovo viagra lze pak zapsat jako: v i a g r a, vi agra, via gra, ….
Petr Čech: Antispamový filtr 15
Textové triky – Kombinace
všechny již uvedené triky lze vzájemně kombinovat, vždy však jen do určité míry
spameři se musí držet pravidla, že příjemce zprávy musí být schopen původní text zprávy přečíst
Petr Čech: Antispamový filtr 16
Textové triky - ostatní
Velké množství vykřičníků – například vykřičník v textu předmětu není u běžných emailových zpráv příliš obvyklý
Apostrofy – více jak jeden apostrof v anglickém slově je podezřelé
Detekce kritických slov – vyhledávání řetězců, které se velmi často vyskytují ve zprávách nevyžádané pošty
Petr Čech: Antispamový filtr 17
Textové triky – výsledek detekce
Výstupem aplikace je xml soubor, který popisuje analyzovaný email: emails_id_0_details.xml
Petr Čech: Antispamový filtr 18
Závěr
Sestavuji kolekci spamových zpráv pro další testování: [email protected] Nejlépe soubory typu *.eml a zabalené