Antispamový filtr

18
Antispamový filtr Petr Čech

description

Petr Čech. Antispamový filtr. Nevyžádaná pošta. Elektronická pošta: Nízké provozní náklady a možnost téměř okamžitého doručení: Elektronická pošta je ideální nástroj předávání nevyžádaných informací. Tak zvaná nevyžádaná pošta . - PowerPoint PPT Presentation

Transcript of Antispamový filtr

Page 1: Antispamový filtr

Antispamový filtrPetr Čech

Page 2: Antispamový filtr

Petr Čech: Antispamový filtr 2

Nevyžádaná pošta

Elektronická pošta: Nízké provozní náklady a možnost téměř

okamžitého doručení:▪ Elektronická pošta je ideální nástroj předávání

nevyžádaných informací.▪ Tak zvaná nevyžádaná pošta.

Nevyžádaná pošta dnes tvoří více jak 60 % všech přenášených zpráv.

Page 3: Antispamový filtr

Petr Čech: Antispamový filtr 3

Nevyžádaná pošta

Problémy: Snížení pracovních výkonů – nutnost

třídit poštu Zvýšení zatížení poštovních serverů Zvýšení provozních nákladů Zhoršení výhodných vlastností

elektronické pošty jako služby …to vše vyžaduje nalezení nějakého

řešení

Page 4: Antispamový filtr

Petr Čech: Antispamový filtr 4

Jak se bránit?

Legislativní opatření: Na vládní úrovni definované právní normy

(neefektivní) Obchodní opatření:

zpoplatněním elektronické pošty nějakou minimální částkou (efektivní ale nepopulární)

Chování uživatelů: správným chováním v prostředí internetu

můžeme množství přijatých nevyžádaných správ výrazně snížit

Technická opatření

Page 5: Antispamový filtr

Petr Čech: Antispamový filtr 5

Technická opatření

Naivní metody – Černé listiny Na internetu existuje několik tzv.

černých listin odesilatelů Při příchodu každého dopisu je zaslán

dotaz, zda stroj, od kterého je zpráva přijímána, nemá záznam v některé černé listině

V kladném případě je taková pošta odmítnuta

Např. projekt MAPS (Mail Abuse Prevention System)

Page 6: Antispamový filtr

Petr Čech: Antispamový filtr 6

Technická opatření

Metody identifikace nevyžádané pošty bez analýzy obsahu zpráv Rozpoznání podezřelé zprávy, aniž by bylo třeba

analyzovat obsah Např. metoda Greylisting:▪ Poštovní server při neúspěšném doručení zařadí zprávu do fronty

a po určitém čase se ji pokusí doručit znovu (oproti tomu rozesílače nevyžádané pošty zprávy rozesílají jednorázově).

▪ Přijímací server si z každého dopisu zjistí IP adresu odesílajícího stroje, adresu odesilatele a adresu příjemce.

▪ V případě, že tuto trojici IP adres již nalezne ve své databázi, zprávu normálně do ručí.

▪ V opačném případě dopis odmítne, informuje o tom odesílající server a novou trojici si zapíše do databáze s příznakem, že po předem určenou dobu nebude dopisy se shodnými parametry přijímat.

Page 7: Antispamový filtr

Petr Čech: Antispamový filtr 7

Technická opatření

Identifikace nevyžádané zprávy na základě analýzy obsahu zpráv Na základě výskytu určitých slov, nebo frází. Dokonalejší metody využívají heuristické

postupy a snaží se “učit“ na základě předkládaných příkladů.

Spolehlivost:▪ u nejlepších kolem 60 – 70%▪ Při určení spolehlivosti je důležitá nejen schopnost

rozpoznat nevyžádanou poštu, ale také počet tzv. “falešných poplachů“, kdy program mezi spam zařadí legitimní zprávu.

Page 8: Antispamový filtr

Petr Čech: Antispamový filtr 8

Analýza obsahu zprávy

elektronická adresa odesilatele předmět emailové zprávy tělo elektronické zprávy:

čistě textový obsah (plain text) webový obsah (html kód) Názvy souborů▪ Obrázky uvnitř webového obsahu▪ Přílohy

Page 9: Antispamový filtr

Petr Čech: Antispamový filtr 9

Triky spamerů

nepoužívání klíčových slov častá změna adresy odesilatele nepoužívání nestandardních příznaků (již se

neobjevují zprávy nevyžádané pošty např. s vysokou prioritou)

obsah zprávy již nemá čistě textový charakter

multimédia maskování (text, který má spamerský

charakter je maskován jiným textem) textové triky

Page 10: Antispamový filtr

Petr Čech: Antispamový filtr 10

Textové triky – Oddělování znaků

jednotlivé znaky, ze kterých se klíčové slovo skládá, lze oddělovat nějakým jiným znakem: v.i.a.g.r.a, v_i_a_g_r_a, v-i-a-g-r-a, …

Page 11: Antispamový filtr

Petr Čech: Antispamový filtr 11

Textové triky – Nahrazování znaků

nahrazování abecedních znaků znakem jiným, který je opticky velmi podobný, různá slova tak lze například zapsat: v1agra (viagra) \ / iagr@ (viagra) w4tch (watch) ord3r (order) …

Page 12: Antispamový filtr

Petr Čech: Antispamový filtr 12

Textové triky – násobení znaků

Již klasickým trikem se také stalo znásobení některého znaku v klíčovém slově: viiiagra (viagra) ooorder (order) …

Page 13: Antispamový filtr

Petr Čech: Antispamový filtr 13

Textové triky – prohazování znaků

některé znaky v klíčovém slově lze snadno prohodit, pro počítačový program je pak text obtížné čitelný, pro člověka ale nikoliv: vaigra vigara Viagar …

Page 14: Antispamový filtr

Petr Čech: Antispamový filtr 14

Textové triky – rozdělování slov

autor nevyžádané zprávy záměrně rozdělí klíčové slovo nahodilým vkládáním mezer, například slovo viagra lze pak zapsat jako: v i a g r a, vi agra, via gra, ….

Page 15: Antispamový filtr

Petr Čech: Antispamový filtr 15

Textové triky – Kombinace

všechny již uvedené triky lze vzájemně kombinovat, vždy však jen do určité míry

spameři se musí držet pravidla, že příjemce zprávy musí být schopen původní text zprávy přečíst

Page 16: Antispamový filtr

Petr Čech: Antispamový filtr 16

Textové triky - ostatní

Velké množství vykřičníků – například vykřičník v textu předmětu není u běžných emailových zpráv příliš obvyklý

Apostrofy – více jak jeden apostrof v anglickém slově je podezřelé

Detekce kritických slov – vyhledávání řetězců, které se velmi často vyskytují ve zprávách nevyžádané pošty

Page 17: Antispamový filtr

Petr Čech: Antispamový filtr 17

Textové triky – výsledek detekce

Výstupem aplikace je xml soubor, který popisuje analyzovaný email: emails_id_0_details.xml

Page 18: Antispamový filtr

Petr Čech: Antispamový filtr 18

Závěr

Sestavuji kolekci spamových zpráv pro další testování: [email protected] Nejlépe soubory typu *.eml a zabalené