Sustavno Prikupljanje Sadrzaja s Weba

25
Nastavna jedinica: Sustavno prikupljanje sadržaja s Weba

Transcript of Sustavno Prikupljanje Sadrzaja s Weba

Page 1: Sustavno Prikupljanje Sadrzaja s Weba

Nastavna jedinica:

Sustavno prikupljanje sadržaja s Weba

Page 2: Sustavno Prikupljanje Sadrzaja s Weba

Možemo reći da je Internet kao medij po mnogim osobinama poseban, jer povezuje različite oblike usluga koje omogućuju spremanje i razmjenu podataka kao i komunikaciju među korisnicima.

Kakav je Internet medij

Page 3: Sustavno Prikupljanje Sadrzaja s Weba

maliciozni (zlonamjerni) programi usmjereni prema računalu

neželjeni sadržaji usmjereni prema korisniku neprovjereni ili neistiniti sadržaji

Tri grupe problema korištenja Interneta

Page 4: Sustavno Prikupljanje Sadrzaja s Weba

Računalni virusi koji se obično prikače za neku izvršnu datoteku, a šire se prenošenjem te datoteke na drugo računalo putem nekog medija za distribuciju (spremnički štapić, CD/DVD) ili elektroničkom poštom (e-mail). Posljedice djelovanja virusa variraju od bezopasnog (koji uglavnom dosađuju korisniku) pa sve do teških posljedica kada dolazi do oštećenja datoteke, programa ili cijelog sustava.

Crv (Worm) je program (ili skupina programa) koji je sposoban samostalno se kopirati i raširiti funkcionalne kopije na druga računala preko mreže.

Trojanski konji imaju svojstvo da na prvi pogled izgledaju poput nekog običnog, korisnog programa, ali ipak nanosi štetu računalu na koje se instalira.

Spyware (špijunski alat) je program koji se preko Interneta instalira na računalo i nepoznatoj osobi šalje podatke o korisnikovoj aktivnosti sa ciljem da ukrade broj kreditne kartice ili druge podatke koje može zloupotrijebiti.

Adware (oglasni alat) koji se bez znanja korisnika instalira na računalo i uznemiruje ga nepoželjnim oglasima.

Maliciozni (zlonamjerni) programi

Page 5: Sustavno Prikupljanje Sadrzaja s Weba

spam je neželjena poruka koja stiže isključivo elektroničkom poštom i u većem opsegu može zatrpati poštanski sandučić (Inbox) elektroničke pošte. Obično su to reklame raznih proizvoda i bezvrijedna pošta sa linkovima na nesigurne stranice.

lažna obavijest (hoax) koja nastoji nagovoriti korisnika na neku radnju koja može biti ilegalna ili može uzrokovati oštećenje računala ako korisnik naivno povjeruje.

phishing je postupak krađe tajnih podataka (zlouporaba identiteta) na način da se korisnika navede na otkrivanje povjerljivih podataka vjerujući da se radi o legalnoj instituciji.

dialer je program koji prekida telefonsku vezu sa davateljem internetske usluge i poziv preusmjerava a neku udaljenu zemlju, a posljedica je enormno velik telefonski račun.

Neželjeni sadržaji usmjereni prema korisniku

Page 6: Sustavno Prikupljanje Sadrzaja s Weba

Internet sadrži veliku količinu informacija, ali nisu sve informacije jednako vrijedne jer svatko može napraviti web stranicu.

Kako između svih tih stranica prepoznati one koje sadrže relevantne informacije, da im možemo vjerovati?

Neprovjereni ili neistiniti sadržaji

Page 7: Sustavno Prikupljanje Sadrzaja s Weba

Koristiti vatrozid (firewall). Vatrozid (firewall) je program koji nadzire (filtrira) prijenos podataka između računala i mreže. Njegova je uloga ograničiti tu komunikaciju tako da zloćudni programi ne mogu bez vašeg znanja pristupiti računalu.

Koristiti antivirusni program. Uloga antivirusnog programa je da na računalu spriječi aktiviranje poznatih zlonamjernih aplikacija, poznatijih pod nazivima virusi, crvi i trojanski konji. Antivirusni program prepoznaje zlonamjerne aplikacije koje su mu poznate uspoređivanjem njihovog koda s bazom takozvanih antivirusnih definicija. Zbog toga je vrlo važno redovito ažurirati (osvježavati) definicije vašeg antivirusnog softvera korištenjem automatskog ažuriranja dostupnog u većini antivirusnih alata (Automatic Update).

Koristiti redovite softverske nadogradnje. Ni jedan program, kao ni operacijski sustav nije savršen program i upravo ti propusti su najveći sigurnosni problemi.

Kako se zaštititi?

Page 8: Sustavno Prikupljanje Sadrzaja s Weba

Ne otvarati privitak elektroničke pošte ako ne poznajemo osobu koja ga je poslala.

Lozinke koje se koriste za različite pristupe ne smiju biti predvidljive jer se lako probiju.

Kada ostavljate osobne podatke na web-obrascima provjerite da li se radi o sigurnim web stranicama (imaju slovo "s" iza protokola - https://). Sjetite se da na internetu, surfajući ili dopisujući se nikad niste sami. Stoga prije nego ostavite osobne podatke dvaput razmislite jer mogu biti upotrijebljeni u zlonamjerne svrhe.

Izbjegavati sumnjive lokacije na Internetu gdje bi mogli biti izloženi zlonamjernim programima.

Ne otvarajte PopUp prozore jer često predstavljaju zamku. Nikad ne instalirajte nepoznat program. Informirajte se o računalnoj sigurnosti.

Praktični savjeti

Page 9: Sustavno Prikupljanje Sadrzaja s Weba

Tražilice (Search Engine) su sustavi za pretraživanje koji za izdvajanje stranica koriste ključne riječi koje korisnik upiše u okvir traženja.

Tematski katalozi sadrže veliku količinu podataka koji su organizirani po temama. Također, kao i tražilice, omogućuju pretraživanje stranica.

U novije vrijeme nastaju web sjedišta koja objedinjuju različite informacije iz većeg broja izvora i nazivaju se portali. Portali često sadrže tematske kataloge i tražilice radi lakšeg dohvata informacija i ljudi ih rado koriste u prvom redu zbog vijesti.

Preuzimanje sadržaja s weba

Page 10: Sustavno Prikupljanje Sadrzaja s Weba

Katalozi◦ pregled sadržaja u knjizi◦ dobro organizirani, po područjima i kategorijama s granama i pridruženim

stavkama, kao mape na računalu◦ malo beskorisnih stranica◦ među najpoznatijim Yahoo – www.yahoo.com

Page 11: Sustavno Prikupljanje Sadrzaja s Weba

◦ programi za pretraživanje interneta, izdvajaju ključne riječi u popis◦ veće od kataloga◦ traženje upisivanjem ključnoga pojma – tražilica pronalazi sve stavke (web

stranica) s ključnim pojmovima◦ kazalo je na kraju knjige slično tražilici◦ među najpoznatijim Google – www.google.hr

Tražilice

Page 12: Sustavno Prikupljanje Sadrzaja s Weba

Enciklopedije Web stranice organizirane su kao enciklopedije. Mnoge se pišu u suradnji s brojnim volonterima, te većinu članaka može mijenjati

svatko s pristupom internetu. Zbog slobodnoga uređivačkog pristupa ne mogu opravdati naziv "enciklopedija“,

koji za sobom povlači visok stupanj pouzdanosti i mjerodavnosti koji one, zbog svoje otvorene uređivačke politike, ne mogu održati.

Primjer wikipedija na hr.wikipedia.org/wiki/Glavna_stranica.

Page 13: Sustavno Prikupljanje Sadrzaja s Weba

Wikipedija Sloboda pristupa, učestala ažuriranja, raznolikost i detaljnost te brojne višejezične

inačice pretvorile su Wikipediju u rado korišten izvor informacija.

Page 14: Sustavno Prikupljanje Sadrzaja s Weba

Google- najpoznatija tražilica- pogodna jer postoji na hrvatskome jeziku- izuzetno brza- vrlo velika baza podataka- jednostavna početna stranica- četiri kategorije pretraživanja

Page 15: Sustavno Prikupljanje Sadrzaja s Weba

Početna stranica Googlea

pretraživanjebilo kakvihpodataka nainternetu

traženje grupa za diskusije i razmjenu mišljenja

pronalaženje slika

web imenik organiziran po kategorijama

automatski odabir prve stranice s popisa

Web

Slike Grupe

Imenik

Upis traženoga pojma Osjećam se sretnim

Izbor za napredno pretraživanje

Page 16: Sustavno Prikupljanje Sadrzaja s Weba

Pretraživanje s pomoću Googlea• U polje za pretragu napišite traženi pojam (ili pojmove).

• Pritisnite gumb Google pretraga.

Page 17: Sustavno Prikupljanje Sadrzaja s Weba

Pretraživanje s pomoću Googlea

- Odaberite željeno iz ponuđenoga izbora.

- Odabir vas vodi na željenu web stranicu.

Page 18: Sustavno Prikupljanje Sadrzaja s Weba

Napredno pretraživanjeGoogle posjeduje izuzetno dobar sustav razvrstavanja rezultata.Ako ponuđeni rezultati ne zadovoljavaju, poslužite senaprednim pretraživanjem.

Page 19: Sustavno Prikupljanje Sadrzaja s Weba

Pohranjivanje sadržaja s weba

Pohranjivanje web dokumenta

• Učitajte stranicu iz ponuđene liste.• Iz izbornika odaberite Datoteka Spremi kao…• Odaberite mjesto na disku i naziv pod kojim ćete stranicu pohraniti.

Page 20: Sustavno Prikupljanje Sadrzaja s Weba

Pohranjivanje sadržaja s weba

Pohranjivanje teksta

• Učitajte stranicu iz ponuđene liste.• Iz izbornika odaberite Datoteka Spremi kao…• Iz okvira Spremi u obliku odaberite Tekstna datoteka.• Odaberite mjesto na disku i naziv pod kojim ćete stranicu pohraniti.

Page 21: Sustavno Prikupljanje Sadrzaja s Weba

Pohranjivanje sadržaja s weba

Pohranjivanje slika

• Učitajte stranicu iz ponuđene liste.• Nad željenom slikom pritisnite desnu tipku miša.• Iz zbornika odaberite Spremi sliku kao…• Iz izbora Spremi u obliku odaberite .JPG ili .GIF.• Odaberite mjesto na disku i naziv pod kojim ćete sliku pohraniti.

Page 22: Sustavno Prikupljanje Sadrzaja s Weba

Opasnost od virusa Virusi su danas najveći problem interneta. Svako računalo bez zaštite, u prosjeku nakon 5 minuta što je spojeno na internet,

ima neku vrstu štetnoga programa.

Page 23: Sustavno Prikupljanje Sadrzaja s Weba

Ukoliko želite ispisati cijelu web stranicu na pisač:◦ Kliknete na izbornik Datoteka (File) Ispis (Print).◦ U dijaloškom okviru Ispis (Print) birate hoćete li ispisati sve ili

samo određene stranice. Za ispis samo označenog teksta na web stranici:◦Označite tekst koji želite ispisati.◦ Desnim klikom na označeni tekst otvorit će se skočni izbornik.◦ U skočnom izborniku kliknite na opciju Ispis (Print).◦ U dijaloškom okviru za ispis označite Odabir (Selection).

Ispis web stranice

Page 24: Sustavno Prikupljanje Sadrzaja s Weba

Logičko I (AND) sužava rezultat pretrage jer uključuje web-stranice koje sadrže sve pojmove navedene u upitu.

Logičko ILI (OR) proširuje rezultat pretraživanja jer uključuje barem jedan od pojmova ili oba zajedno.

Logičko NE (NOT) sužava pretraživanje jer uključuje samo jedan od pojmova iz upita i pri tome isključuje drugi.

Tražilica Google omogućuje poseban obrazac naprednog pretraživanja.

Sužavanje ili proširivanje rezultata pretrage tražilica

Page 25: Sustavno Prikupljanje Sadrzaja s Weba

Web (World Wide Web) – usluga pregledavanja web-stranica na Internetu. Virus – računalni program koji je napravljen kako bi bez korisnikovog znanja

ušao u njegovo računalo i načinio neku štetu. Antivirusni program – program za zaštitu računala od virusa. Viruse otkriva pri

pokušaju ulaska u računalo i uništava ih. Neželjena poruka (Spam) – bezvrijedna poruka elektroničke pošte (e-mail) od

nepoznatog pošiljatelja. Web-preglednik (Web-browser) – program za pregledavanje sadržaja na web

stranicama. Web-tražilica (Search engine) – usluga za pretraživanje sadržaja na Internetu

pomoću ključnih riječi. Ključna riječ – pojam koji najbolje opisuje sadržaj koji tražimo na Intrenetu. Tematski katalozi (Web directory) – usluga za pretraživanje sadržaja na

Internetu putem web stranica gdje su sadržaji razvrstani po kategorijama i podkategorijama.

Download – preuzimanje sadržaja sa Interneta i spremanje na lokalno računalo. Upload – slanje podataka sa lokalnog na udaljeno računalo.

Pojmovi