Anna Gabińska SWPS

13
LIWC2001 LIWC2001 Linguistic Inquiry and Word Linguistic Inquiry and Word Count Count ( (James W. Pennebaker Martha E. Francis & Roger J Booth; www.liwc.net ) ) Anna Gabińska Anna Gabińska SWPS SWPS

description

LIWC2001 Linguistic Inquiry and Word Count ( James W. Pennebaker Martha E. Francis & Roger J Booth; www.liwc.net ). Anna Gabińska SWPS. LIWC – zasady działania:. Liwc został zaprojektowany do analizowania pisanego tekstu na zasadzie słowo po słowie. Przystosowany do pracy na PC i Macintosh - PowerPoint PPT Presentation

Transcript of Anna Gabińska SWPS

Page 1: Anna Gabińska SWPS

LIWC2001LIWC2001

Linguistic Inquiry and Word CountLinguistic Inquiry and Word Count((James W. Pennebaker Martha E. Francis & Roger J Booth; www.liwc.net))

Anna GabińskaAnna Gabińska

SWPSSWPS

Page 2: Anna Gabińska SWPS

LIWC – zasady działania:LIWC – zasady działania:

Liwc został zaprojektowany do analizowania pisanego Liwc został zaprojektowany do analizowania pisanego tekstu na zasadzie słowo po słowie.tekstu na zasadzie słowo po słowie.Przystosowany do pracy na PC i MacintoshPrzystosowany do pracy na PC i MacintoshForma zapisywania wyników analiz umożliwia łatwe Forma zapisywania wyników analiz umożliwia łatwe transportowanie ich do SPPS-a lub Excelatransportowanie ich do SPPS-a lub ExcelaAnaliza tekstu oparta jest o wyszukiwanie w tekście słów Analiza tekstu oparta jest o wyszukiwanie w tekście słów i rdzeni wyrazowych.i rdzeni wyrazowych.

matemate hungr* - hungry, hungrier, hungriesthungr* - hungry, hungrier, hungriest * gwiazdka oznacza, że brane będą pod uwagę wszyskie * gwiazdka oznacza, że brane będą pod uwagę wszyskie

litery, cyfry oraz łączniki.litery, cyfry oraz łączniki.Każde słowo lub rdzeń wyrazowy przypisany jest do Każde słowo lub rdzeń wyrazowy przypisany jest do jednej lub więcej kategorii.jednej lub więcej kategorii.

Page 3: Anna Gabińska SWPS

LIWC2001 – zasady działania:LIWC2001 – zasady działania:

Umożliwia pracę z wieloma plikami tekstowymi Umożliwia pracę z wieloma plikami tekstowymi jednocześnie. Analizuje jeden plik po drugim.jednocześnie. Analizuje jeden plik po drugim.Proces analizy jednej strony z pojedynczymi Proces analizy jednej strony z pojedynczymi odstępami zajmuje ułamek sekundy.odstępami zajmuje ułamek sekundy.Słowa w tekście analizowane są jedno po Słowa w tekście analizowane są jedno po drugim → przeszukiwanie słownika → zgodność drugim → przeszukiwanie słownika → zgodność słowa tekstowego ze słownikowym powoduje słowa tekstowego ze słownikowym powoduje wzrost na skali danej kategorii.wzrost na skali danej kategorii.Analiza tekstu obejmuje również strukturalne Analiza tekstu obejmuje również strukturalne elementy: ilość słów, średnia ilość słów elementy: ilość słów, średnia ilość słów przypadająca na zdanie.przypadająca na zdanie.

Page 4: Anna Gabińska SWPS

LIWC2001 – zasady działania:LIWC2001 – zasady działania:

Oblicza procent słów występujących w tekście dla Oblicza procent słów występujących w tekście dla każdego z 74 wymiarów lingwistycznych. każdego z 74 wymiarów lingwistycznych.

Wszystkie zmienne (oprócz [WC] – ilość słów, Wszystkie zmienne (oprócz [WC] – ilość słów, [WPS] średnia ilość słów w zdaniu, [Qmarks] [WPS] średnia ilość słów w zdaniu, [Qmarks] procent zdań kończących się znakiem zapytania) procent zdań kończących się znakiem zapytania) odzwierciedlają procent wszystkich użytych słów.odzwierciedlają procent wszystkich użytych słów.

wynik 1,59 dla zaimka „I” oznacza, że 1,6% tekstu wynik 1,59 dla zaimka „I” oznacza, że 1,6% tekstu składa się z „I”.składa się z „I”.

Page 5: Anna Gabińska SWPS

LIWC2001 – słownik:LIWC2001 – słownik:2,300 słów i rdzeni wyrazowych.2,300 słów i rdzeni wyrazowych.Rozpoznaje około 80% słów używanych w mowie i piśmie.Rozpoznaje około 80% słów używanych w mowie i piśmie.74 kategorie:74 kategorie:

- (17) język standardowy - ilość słów, przyimki, zaimki, negacje(17) język standardowy - ilość słów, przyimki, zaimki, negacje- (25) konstrukty psychologiczne - emocje, procesy poznawcze (25) konstrukty psychologiczne - emocje, procesy poznawcze - (10) relatywność - czas, ruch, przestrzeń(10) relatywność - czas, ruch, przestrzeń- (19) sprawy osobiste – praca, dom, stany fizyczne, pieniądze(19) sprawy osobiste – praca, dom, stany fizyczne, pieniądze- (3) eksperymentalne – przekleństwa, „nonfluencies”, „fillers” (3) eksperymentalne – przekleństwa, „nonfluencies”, „fillers”

- Kategorie zorganizowane są w sposób hierarchiczny. Kategorie zorganizowane są w sposób hierarchiczny. Przykładowo wszystkie słowa związane z kategorią Przykładowo wszystkie słowa związane z kategorią „wściekłość” są także włączone do kategorii emocji „wściekłość” są także włączone do kategorii emocji negatywnych i słów afektywnych.negatywnych i słów afektywnych.

Page 6: Anna Gabińska SWPS

LIWC2001 – słownik:LIWC2001 – słownik:

Jeśli użytkownik chce może dodatkowo Jeśli użytkownik chce może dodatkowo analizować numery, skróty i emotikony.analizować numery, skróty i emotikony.

Możliwość tworzenia własnych kategorii i Możliwość tworzenia własnych kategorii i słownikówsłowników

Ignoruje znaki większość znaków Ignoruje znaki większość znaków interpunkcyjnych (przecinki, dwukropki, też: interpunkcyjnych (przecinki, dwukropki, też: @, &, + itp.. o ile nie są emotikonami)@, &, + itp.. o ile nie są emotikonami)

Page 7: Anna Gabińska SWPS

Funkcje dodatkowe słownika:Funkcje dodatkowe słownika:Kategorie warunkowe – możliwość podstawowej analizy Kategorie warunkowe – możliwość podstawowej analizy kontekstowejkontekstowej

Like (01 23)12/69Like (01 23)12/69 - jeśli słowo poprzedzające „like” należy do kategorii 01 - jeśli słowo poprzedzające „like” należy do kategorii 01

(zaimek) lub 23 (niezgodność – ‘discrepancy’) to „like” (zaimek) lub 23 (niezgodność – ‘discrepancy’) to „like” należy zaklasyfikować do kategorii 12 (afekt). W innym należy zaklasyfikować do kategorii 12 (afekt). W innym przypadku „like” należy przypisać do kategorii 69 przypadku „like” należy przypisać do kategorii 69 (podobieństwo).(podobieństwo).

Like (01 23)00/69Like (01 23)00/69 - „00” oznacza, że jeśli słowo poprzedzające „like” należy do - „00” oznacza, że jeśli słowo poprzedzające „like” należy do

kategorii 01 lub 23, to „like” nie powinno być przypisane do kategorii 01 lub 23, to „like” nie powinno być przypisane do żadnej kategorii. W innym przypadku „like” należy żadnej kategorii. W innym przypadku „like” należy zaklasyfikować do kategorii 69 (podobieństwo).zaklasyfikować do kategorii 69 (podobieństwo).

Like (01 23)13Like (01 23)13- jeśli słowo poprzedzające „like” należy do kategorii 01 - jeśli słowo poprzedzające „like” należy do kategorii 01

(zaimek) lub 23 (niezgodność) to „like” należy (zaimek) lub 23 (niezgodność) to „like” należy zaklasyfikować do kategorii 13 (afekt). W innym przypadku zaklasyfikować do kategorii 13 (afekt). W innym przypadku „like” należy pominąć w analizie.„like” należy pominąć w analizie.

Page 8: Anna Gabińska SWPS

Funkcje dodatkowe słownika:Funkcje dodatkowe słownika:

Kind <of>20/12<of>25/13Kind <of>20/12<of>25/13 - jeśli „of” następuje po słowie „kind” , to „kind” należy - jeśli „of” następuje po słowie „kind” , to „kind” należy

przypisać do kategorii 20 (możliwy - ‘przypisać do kategorii 20 (możliwy - ‘tentative’tentative’). W ). W innym przypadku „kind” należy przypisać do kategorii 12 innym przypadku „kind” należy przypisać do kategorii 12 (afekt).(afekt).

Kind <of>00/12Kind <of>00/12 - „00” oznacza, że jeśli „of” następuje po słowie „kind” , to - „00” oznacza, że jeśli „of” następuje po słowie „kind” , to

„kind” nie powinno być przypisane do żadnej kategorii. W „kind” nie powinno być przypisane do żadnej kategorii. W innym przypadku „kind” należy przypisać do kategorii 12 innym przypadku „kind” należy przypisać do kategorii 12 (afekt). (afekt).

Kind <of>20Kind <of>20 - jeśli „of” następuje po słowie „kind”, to „kind” powinno być - jeśli „of” następuje po słowie „kind”, to „kind” powinno być

zaklasyfikowane do kategorii 20. W innym przypadku zaklasyfikowane do kategorii 20. W innym przypadku „like” należy pominąć w analizie.„like” należy pominąć w analizie.

Page 9: Anna Gabińska SWPS

Powstawanie słownikaPowstawanie słownika

Page 10: Anna Gabińska SWPS

Przygotowanie tekstu do analizyPrzygotowanie tekstu do analizy

Plik w formacie text lub ASCIIPlik w formacie text lub ASCII

„„czyszczenie tekstu” – poprawianie literówek i czyszczenie tekstu” – poprawianie literówek i nieprawidłowego użycia słów („its” a it’s”). nieprawidłowego użycia słów („its” a it’s”).

Błędy gramatyczne, struktura zdań oraz pisownia Błędy gramatyczne, struktura zdań oraz pisownia dużymi i małymi literami nie wymaga poprawek.dużymi i małymi literami nie wymaga poprawek.

skróty skróty - Jan – January- Jan – January- don’t, won’t, isn’t, shouldn’t, can’t, couldn’t, I’m, I’ll, don’t, won’t, isn’t, shouldn’t, can’t, couldn’t, I’m, I’ll,

I’d, we’re, we’d, you’re, he’s, it’s etc.I’d, we’re, we’d, you’re, he’s, it’s etc. Sally’s shoes & Sally’s going out Sally’s shoes & Sally’s going out (→ Sally is going out)(→ Sally is going out)

Page 11: Anna Gabińska SWPS

Przygotowanie tekstu do analizyPrzygotowanie tekstu do analizy

kropki i łącznikikropki i łączniki- Jeśli nie chcemy zliczać skrótów należy je zamienić Jeśli nie chcemy zliczać skrótów należy je zamienić

na pojedyncze słowa: U.S. →nie US (zaimek 1os. na pojedyncze słowa: U.S. →nie US (zaimek 1os. l.mn) tylko USAl.mn) tylko USA

- 7:30 a.m. → 7:30am7:30 a.m. → 7:30am- Self-esteem – wyrazy połączone łącznikiem tworzą Self-esteem – wyrazy połączone łącznikiem tworzą

jedno słowojedno słowo fraza „this-or-that” → „this – or – that”fraza „this-or-that” → „this – or – that”

Page 12: Anna Gabińska SWPS

Przygotowanie tekstu do analizyPrzygotowanie tekstu do analizy

Transkrypacje tekstów mówionychTranskrypacje tekstów mówionych- nonfluencies: hmm, uhh, uhm, um, mm, er nonfluencies: hmm, uhh, uhm, um, mm, er

„ „The, the bo-, the boat is there” → „Uh, Uh, The, the bo-, the boat is there” → „Uh, Uh, the boat is there”the boat is there”

„ „Huh?” → „what?”Huh?” → „what?”- fillers: you know, I mean, like → youknow, fillers: you know, I mean, like → youknow,

Imean, rrlikeImean, rrlike- Tekst nie zrozumiały → xxxTekst nie zrozumiały → xxx

Page 13: Anna Gabińska SWPS

Wersja polska LIWCAWersja polska LIWCA