UN ESPERIMENTO DI MATCHED GUISE IN TOSCANA · sposa bene con la tradizionale sociolinguistica...

UN ESPERIMENTO DI MATCHED-GUISE IN TOSCANA

SILVIA CALAMAI & IRENE RICCI∗

“L’idea che per raggiungere la chiarezza su un termine generale si debba trovare l’elemento comune a tutte le sue applicazioni ha messo in gabbia la ricerca filosofica perché non solo non ha portato a nessun risultato, ma ha anche indotto il filosofo a giudicare irrilevanti i casi concreti, i quali soli avrebbero potuto aiutarlo a comprendere l’uso del termine generale” (L. Wittgenstein, Libro blu e libro marrone)

1. Dalla produzione all’ascolto

Grazie alla sintesi vocale è possibile costruire esperimenti percettivi in

cui, sotto il diretto controllo del ricercatore, vengono modificati nella

catena sonora soltanto certi attributi fonetici; siffatte variazioni,

calibrate sperimentalmente, consentono anche di meglio individuare

quali caratteristiche fonetiche siano sfruttate dai parlanti come segnali

di appartenenza diatopica. Come viene suggerito efficacemente in

Preston (in stampa), con la sintesi vocale le ricerche dialettologiche

possono in qualche modo arginare i difetti di analisi relativi alla

percezione sonora (ciò che si ascolta è davvero ciò che viene

acusticamente prodotto?), mentre gli studi sulle attitudini linguistiche

possono essere in parte tutelati da errori relativi alla produzione (si

∗ La redazione scritta dell’articolo è opera di Silvia Calamai. La parte sperimentale del lavoro è stata curata da entrambe le autrici; la parte statistica è stata svolta da Irene Ricci. Un ringraziamento sentito va alle tre scuole superiori coinvolte nell’esperimento (Istituto Tecnico Agrario di Firenze, ITIS “Leonardo da Vinci” di Pisa, Istituto Tecnico Statale Commerciale e per Programmatori “A. Vespucci – P. Calamandrei” di Livorno) e ai docenti che nel periodo settembre-novembre 2004 hanno reso possibili gli incontri con gli studenti. Il percorso di ricerca qui delineato ha potuto beneficiare di osservazioni preziose da parte di Pier Marco Bertinetto, Giovanna Marotta e Rosanna Sornicola.

64

reagisce alle voci giudicate differenti o si reagisce a particolari tratti

fonetici indirettamente veicolati da queste voci?).

L’area toscana è abbastanza coperta per quanto concerne gli studi

acustici, e può a nostro avviso rappresentare un buon laboratorio di

analisi per ricerche costruite in chiave sociofonetica (Thomas 2002:

189-190; Clopper & Pisoni 2005: 328), che prendano in esame anche

aspetti di tipo percettivo1: sappiamo (o cominciamo a sapere) come i

parlanti adoperano certe variabili ma abbiamo pochissime

informazioni su come queste variabili siano interpretate dagli

ascoltatori.

L’indagine qui presentata ha pertanto un carattere esplorativo: fa

tesoro delle conoscenze acquisite sul versante acustico, utilizzando al

contempo una metodologia mutuata anche dalla dialettologia

percettiva (Cini & Regis 2002), la quale permette di osservare “come

la gente percepisce – non nel senso di ‘riceve, decodifica’ ma nel

senso di ‘intende/reagisce a’ – il linguaggio” (Berruto 2002: 343): la

ricerca vorrebbe essere pertanto un primo passo verso un più ampio

studio capace di sfruttare le conoscenze acquisite sul versante acustico

per meglio comprendere cosa succeda “dalla parte dell’ascoltatore”.

Proprio per questo suo carattere di indagine ‘pilota’, solo

1 Richiamiamo in nota alcuni dei lavori recenti compiuti nell’ambito della fonetica sperimentale. Diversi fenomeni consonantici sono affrontati in Marotta (2001), Marotta & Nocchi (2001), Marotta et aliae (2002), Nocchi (2002; 2003; 2004); alcuni sistemi vocalici sono descritti in Sorianello (2001; 2002), Calamai (2001; 2004a; 2004b). Aspetti prosodici sono trattati in Marotta & Sorianello (2001); Gili Fivela (2004); Marotta (2002); Brigato & Marotta (2002); Marotta & Sardelli (2003); Marotta, Calamai & Sardelli (2004). Per la durata vocalica e consonantica disponiamo delle indagini di Turchi & Bertinetto (2000), di Dell’Aglio, Bertinetto & Agonigi (2002), di Dell’Aglio (2003; 2004).

65

secondariamente ricorre all’analisi statistica, pur essendo abbastanza

consistente il campione di soggetti utilizzato nell’esperimento.

I dati sulla percezione di cambiamenti temporali e frequenziali sono

stati elicitati attraverso la tecnica cosiddetta matched-guise (§ 2),

utilizzata soprattutto negli studi di psicologia sociale e di

sociolinguistica2. Esperimenti sul campo che registrano le reazioni

percettive dei parlanti, così come le loro valutazioni soggettive,

possono essere interpretati pienamente soltanto se vengono confrontati

con l’uso effettivo: l’indagine è stata pertanto condotta in tre città –

Pisa, Livorno e Firenze – che sono già state descritte sul piano

acustico. Non sono molti gli studi che si propongono di combinare

fonetica acustica e dialettologia percettiva: la parte concernente i veri

e propri risultati (§ 5) è pertanto preceduta da alcune riflessioni

metodologiche, anche per mostrare il carattere controverso di certe

scelte relative alla costruzione del disegno sperimentale; alcune pagine

sono quindi dedicate alla presentazione del questionario (§ 3) e alla

costruzione delle batterie di stimoli (§ 4).

I fenomeni osservati riguardano il particolare vocalismo tonico di area

livornese e pisana, che si manifesta in un consistente abbassamento

2 In area italiana non sono molti i lavori che vi ricorrono, con diversi aggiustamenti (cfr. Baroni 1983; Volkart-Rey 1990; Antonini & Moretti 2000), e in ogni caso non nella prospettiva adottata in questa indagine. Risulta peraltro difficile trovare una univoca traduzione di matched-guise: in Berruto (1995: 113) si propone “travestimenti (di voci) a confronto”, in Volkart-Rey (1990: 30) “mascheramento (di voci) a confronto”, in Cardona (1988: 132) “falsa coppia”. Anche per questo abbiamo preferito mantenere l’etichetta inglese.

66

delle vocali medio-basse3 e nella velarizzazione di /a/, e che appare

un tratto ‘bandiera’, ben percepito dagli stessi parlanti (Calamai

2002). Gli aspetti acustici in gioco non si limitano all’abbassamento

della prima formante (peraltro concentrato su alcuni foni vocalici e

non esteso a tutto il sistema), ma coinvolgono anche il dominio

prosodico: nel parlato meno controllato si osserva una maggiore

durata per alcune vocali (in special modo quelle colpite da

abbassamento) e – soprattutto nelle parole prominenti – una maggiore

modulazione della frequenza fondamentale4. L’abbassamento delle

medio-basse è accompagnato (o, più probabilmente, preceduto) dalla

velarizzazione di /a/, che nell’area occidentale toscana occupa un’area

piuttosto posteriore dello spazio acustico (Calamai 2004a). Visto che

le differenze in gioco si situano sul piano della realizzazione (per le tre

città il sistema fonologico è, ovviamente, lo stesso) e visto che il

vocalismo fiorentino appare, da questo punto di vista, più neutro,

l’indagine vuole valutare se alcune variabili acustiche siano

sufficientemente salienti per segnalare l’appartenenza diatopica del

parlante.

3 La vocale // è spesso realizzata come [æ]: l’assetto acustico dell’area ha, nell’accezione di Ladefoged (1984), un carattere ‘asimmetrico’. 4 Marotta, Calamai & Sardelli (2004). Resta ancora da comprendere in maniera approfondita la presenza di una maggiore instabilità formantica e di (più o meno evidenti) dittongazioni in tipologie più libere di parlato; di dittongazioni – limitatamente a una pronuncia ‘marcata’ – scrive ad esempio Canepari (1999: 409-410).

67

2. La tecnica matched-guise

La tecnica utilizzata nell’esperimento è una particolare versione del

test denominato matched-guise, ideato negli anni Sessanta dal

canadese Wallace Lambert nel contesto bilingue francese-inglese: il

test intende stimolare situazioni e contesti in cui la riflessione

metalinguistica possa sorgere in maniera indiretta, evitando il ricorso a

domande esplicite. Nella sua forma canonica, i soggetti ascoltano

campioni di parlato da voci che vengono presentate dallo

sperimentatore come differenti e devono attribuire valutazioni

soggettive in relazione alla personalità di chi emette la voce ascoltata.

In realtà, le voci sono prodotte da uno stesso parlante che assume

differenti sembianze (guises), sfruttando diverse selezioni di variabili

linguistiche: in questo modo, quando un ascoltare risponde in maniera

divergente a due versioni della stessa voce, la differenza nel giudizio

può essere attribuita alla presenza/assenza di una particolare variabile.

È dunque possibile ottenere non reazioni inconsce alle voci (in realtà

emesse da un unico parlante) ma reazioni alle diverse lingue o alle

diverse varietà di lingua. Il vincolo dell’unico parlante pone tuttavia

delle limitazioni oggettive, legate alla evidente difficoltà di reperire

soggetti che siano perfettamente bilingui o che riescano comunque a

dominare allo stesso modo differenti varietà di lingua: anche per

questo motivo, la tecnica ha subito modifiche e aggiustamenti, come

68

ad esempio nel cosiddetto verbal guise5, in cui parlanti differenti

forniscono le differenti voci in diverse varietà di lingua.

Rispetto a metodologie più dirette, quali i questionari, una siffatta

tecnica permette un alto grado di introspezione e produce dunque

risposte più spontanee, anche se ha vari punti deboli, soprattutto nella

sua parte sperimentale: in primo luogo, viene usata in situazioni

(classi, laboratori) che non sono molto naturali e che in qualche modo

pongono costrizioni al soggetto, al quale peraltro viene chiesto un

compito piuttosto artificiale, poiché molto raramente può accadere che

le persone esprimano giudizi su altre persone soltanto sulla base della

voce. Inoltre, la ripetizione dello stesso messaggio all’interno delle

batterie di test porta il soggetto a concentrarsi sui tratti linguistici in

una maniera profondamente diversa rispetto a quanto avverrebbe in

una situazione comunicativa ‘normale’6. Infine, tale tecnica – che si

sposa bene con la tradizionale sociolinguistica correlativa e che è

preziosa per indagare variabili fonetiche – è stata criticata nei lavori di

impostazione interpretativa e pragmatica “per il suo basarsi su una

concezione statica del rapporto fra comportamento linguistico,

atteggiamenti e contesto situazionale” (Berruto 1995: 115).

Nella nostra ricerca viene usata non per indagare la percezione, da

parte dei parlanti, delle stratificazioni sociali così come queste

vengono veicolate dalla pronuncia, ma per valutare se certi indici

5 Una panoramica relativa a queste metodologie è in Ryan, Giles & Hewstone (1988). 6 Vd. quanto si scrive in § 4 a proposito della percezione dei cambiamenti di durata. Nel versione originale della tecnica, c’è anche il rischio che le voci siano giudicate sulla base dello stile di lettura e non sulla produzione linguistica vera e propria.

69

fonetici siano sufficienti a indicare la provenienza del parlante, alla

maniera con cui – mutatis mutandis – in Graff, Labov & Harris (1986)

è stata indagata la differenza tra black e white English nella parlata di

Philadelphia. Nella formulazione originale di Lambert, la tecnica non

mira a pesare la salienza relativa di specifici tratti linguistici; nella

versione modificata di Graff, Labov & Harris (1986) il focus ricade su

particolari tratti linguistici dotati di valenza sociolinguistica, tratti che

vengono sistematicamente variati mentre tutto il resto del materiale

fonico è mantenuto costante. Il disegno sperimentale costruito dagli

autori mira a valutare l’esistenza di una correlazione tra determinate

realizzazioni foniche e l’identità ‘etnica’: in particolare, viene

modificato un singolo suono7 nell’enunciato lasciando inalterata la

naturalezza della produzione linguistica col duplice scopo di valutare,

nel confronto tra black English e white English, sia il grado di

consapevolezza dei cambiamenti fonetici presso i parlanti, sia se

questi cambiamenti fonetici sono in grado di agire da ‘denominatori

etnici’ (markers of ethnic identity) all’interno della comunità

linguistica8.

7 Nella fattispecie, la diversa realizzazione dei dittonghi /aw/ e /ow/. 8 In tempi più recenti, anche nelle ricerche di Dennis Preston e di Nancy Niedzielski si fa ricorso alla sintesi vocale per indagare la relazione fra la percezione vocalica e i meccanismi del cambiamento linguistico presenti nell’area di Detroit (cfr. Niedzielski 1995, 1999; Preston 1997). In particolare, Niedzielski (1999) ricorre al cosiddetto vowel-matching, un compito sperimentale che mostra come la percezione vocalica non abbia un carattere assoluto e invariante ma al contrario sia mediata dalle conoscenze, reali o presunte tali, che del parlante ha l’ascoltatore (la provenienza, in primo luogo).

70

3. Costruzione del questionario

Il campione è costituito da una categoria relativamente omogenea di

soggetti, rappresentata da 55 studenti di V classi degli istituti tecnici di

Pisa, di Firenze e di Livorno9. La scelta si è concentrata su questa

popolazione poiché il versante per così dire ‘ingenuo’, legato alle

opinioni linguistiche, è stato oggetto di una precedente ricerca

condotta in quattro scuole superiori di Livorno e di Pisa (Calamai

2002). È quindi possibile mettere parzialmente a confronto le due

indagini per ottenere un quadro più preciso relativo alle dinamiche in

azione sul versante della linguistica ‘soggettiva’.

Differenti sezioni compongono il questionario, la cui struttura

apparentemente eterogenea è riportata nella Tab.1. Nella prima

domanda si chiedono informazioni generali riguardanti il soggetto

stesso10, il quale – nella seconda parte – viene invitato a descrivere il

proprio dialetto con accenni a possibili differenze generazionali. La

terza parte riguarda la creazione di mappe percettive: in una cartina

della Toscana il soggetto deve collegare insieme quelle zone giudicate

‘simili’ per quanto concerne la parlata. La quarta sezione riguarda i

confini vocalici e intende valutare la presenza di un effetto del luogo

di provenienza nella categorizzazione di coppie minime in cui

vengono modificate le formanti della vocale tonica (Calamai & Ricci,

in stampa). Le sezioni quinta e sesta del questionario prevedono

9 In ciascuna scuola, le sessioni sperimentali – della durata di circa un’ora – si sono svolte nel laboratorio linguistico e sono state precedute da una descrizione dettagliata del questionario; gli studenti, muniti di cuffia, hanno svolto il compito in banchi isolati fra loro. 10 Località di provenienza, età, sesso, luogo di nascita dei genitori.

71

l’utilizzo della tecnica matched-guise per quanto concerne la

percezione dei cambiamenti frequenziali e temporali in / a/

all’interno di parole isolate e, limitatamente alla percezione dei

cambiamenti temporali, in // e in // all’interno di frasi di parlato

semispontaneo. Infine, l’ultima parte si concentra più direttamente

sugli atteggiamenti linguistici e intende elicitare valutazioni soggettive

a frasi di parlato semispontaneo pronunciate da locutori provenienti da

Pisa, Firenze e Livorno11.

1 Informazioni sul soggetto (età, luogo di nascita, sesso)

2 Dialettologia ‘ingenua’ (informazioni sulla propria parlata e sulle differenze generazionali)

3 Mappe percettive

4 Confini tra vocali adiacenti (risposte chiuse)

5 Matched-guise – percezione della modifiche di durata e delle modifiche timbriche per //, // e /a/ in parole isolate (risposte chiuse)

6 Matched-guise – percezione della durata per // e // in frasi di parlato semispontaneo (risposte chiuse)

7 Indagine sugli elementi non linguistici (socio-culturali) associati a frasi di parlato semispontaneo prodotte da parlanti di Pisa, Firenze, Livorno (risposte aperte)

Tab.1 Schema del questionario

In un questionario costruito con l’apporto di diverse prospettive, le

attitudini verso alcune varietà di lingua, così come le relazioni tra

particolari fenomeni fonetici e la loro provenienza geografica possono

11 La parte relativa alle mappe percettive e quella relativa all’ultima sezione del questionario è oggetto di un contributo a parte, in fase di avanzata elaborazione.

72

essere utilmente rapportate con la percezione soggettiva dei confini tra

le diverse parlate toscane12.

4. Costruzione delle batterie sperimentali: scelte metodologiche e

procedure operative

Gli aspetti metodologici implicati nella costruzione del test matched-

guise mediante l’ausilio della sintesi vocale sono molti e abbastanza

complessi. In primo luogo, lo sperimentatore deve decidere che tipo di

materiale manipolare, sia da un punto di vista della modalità di parlato

(se naturale o sintetico)13, sia da un punto di vista della

caratterizzazione diatopica (italiano neutro o italiano regionale di base

toscana?)14, sia infine da un punto di vista della caratterizzazione

diafasica (parlato letto, altamente controllato, o parlato più ‘libero’,

ipoarticolato?). Se la scelta si colloca verso il polo alto tra i due

estremi supra descritti (se, ad esempio, si decide di utilizzare una lista

di parole lette da uno speaker professionista privo di inflessione

dialettale o regionale), lo sperimentatore deve poi decidere se usare

parole o pseudoparole: nel caso delle parole, il risultato potrebbe

venire ‘sporcato’ da un effetto frequenza15; nel caso delle

pseudoparole, il compito potrebbe diventare innaturale e

particolarmente difficile senza uno specifico addestramento. Anche

12 Cfr. Preston (1989: 3); Williams, Garrett, Coupuland (1999: 345-346); Clopper & Pisoni (2005: 319). 13 L’intelligibilità e la comprensione di parlato sintetico sono diverse rispetto alla comprensione e alla intelligibilità di parlato naturale (Liu & Kewley-Port 2004). 14 Con tutti i dubbi che simili etichette si portano dietro. 15 L’informazione lessicale può influenzare l’identificazione della parola (Ganong 1980).

73

per questi motivi, l’indagine non si è concentrata su di un solo stile

d’eloquio: l’esperimento prevede sia una sessione con materiale

proveniente da parlato letto (§ 5.1), sia una sessione – più piccola –

costruita con materiale proveniente da parlato semispontaneo (§ 5.2).

Obiettivo della ricerca è valutare se una differenza relativa ai valori

frequenziali o temporali nella vocale tonica è sufficiente per segnalare

una distinzione fra le tre città toscane; se, in altre parole, è sufficiente

per agire come segnale ‘geografico’. Dal momento che l’indagine non

si concentra su aspetti squisitamente linguistici, ma punta l’attenzione

sul legame tra fatti di lingua e (eventuale) marcatezza diatopica, le

modifiche ai valori formantici e a quelli di durata sono state compiute

per passi piuttosto macroscopici16: 50-100 Hz per le formanti, 22-32

ms per gli incrementi temporali del 20%17, 57-80 ms (nel parlato letto)

e 71-111 ms (nel parlato semispontaneo) per gli incrementi temporali

del 50%. Le modifiche formantiche avvengono dunque mediante

intervalli superiori ai valori soglia percepibili dall’orecchio umano,

nonostante in letteratura questi valori non siano univoci (cfr. Flanagan

1955, 1957; Mermelstein 1978; Kewley-Port & Watson 1994)18.

Anche nel caso dei cambiamenti in durata, non c’è accordo completo

16 Un percorso differente è stato adottato nelle batterie di coppie minime, ove l’attenzione è concentrata sul confine categoriale tra vocali contigue nello spazio acustico (Calamai & Ricci, in stampa). 17 La motivazione alla base di tale valore percentuale è discussa infra. 18 Gli incrementi percentuali di F1 sono del 19,4%, del 29,1% e del 38,8% per lo stimolo esplodere e del 22,2%, del 33,4%, del 44,5% per lo stimolo perfetto. Nel caso di calco, la F1 è stata diminuita del 6,1% e del 12,3%, mentre la F2 è stata diminuita del 7,8% e del 15,7%. Ricordiamo che in Kewley-Port & Watson (1994) la soglia per la discriminazione uditiva delle frequenze formantiche è stabilita, per F1, in circa 14 Hz e, per F2, in circa l’1.5% del valore della stessa formante.

74

su quale sia il valore delle minime differenze temporali che l’orecchio

può percepire: le cosiddette Just Noticeable Differences (JND) sono

comprese tra i 10 e i 40 ms (Lehiste 1970: 11-13; Klatt 1976: 1218-

19)19. L’intervallo temporale relativamente esteso che emerge dai vari

risultati presenti in letteratura potrebbe essere spiegato, in parte, dallo

stesso disegno sperimentale: il fatto che in molte indagini la medesima

parola target sia ripetuta più volte permette all’ascoltatore di

sviluppare strategie in grado di affilare la propria capacità di udire

differenze temporali anche piccole (Klatt 1976: 1219; O’Shaughnessy

1987: 160-161). L’aumento del 50% della durata vocalica è dunque un

aumento senza dubbio percepibile; in ogni caso, nella costruzione

delle batterie sperimentali, è stato inserito anche un allungamento per

così dire ‘intermedio’, del 20%: soltanto le modifiche temporali che

raggiungono questa soglia possono servire come indici percettivi

primari (Klatt 1976: 1219).

Sempre in relazione al protocollo di analisi sono da menzionare,

seppur in maniera cursoria, altri caveat relativi a fattori quali

l’addestramento dei soggetti, l’esistenza di strategie individuali nei

compiti uditivi, le condizioni ambientali in cui è stato svolto il test. In 19 La sensibilità ai cambi di durata dipende essenzialmente da tre fattori (Klatt & Cooper 1975): la durata intrinseca del segmento (le JND sono direttamente proporzionali alla durata complessiva del segmento), la posizione della sillaba nella parola (la sensibilità ai cambi di durata è maggiore per i segmenti in sillabe non finali di parola), la posizione della parola nell’enunciato. I soggetti sono più sensibili a mutamenti nella durata delle vocali rispetto a mutamenti nella durata delle consonanti (Huggins 1972: 1274); alterazioni nella durata della vocale influenzano l’accettabilità di un item più delle alterazioni nella durata della consonante (Carlson & Granström 1975). Infine, sulla percezione della durata di un fono vocalico

75

primo luogo, anche se la parte sulla percezione dei cambiamenti di

durata e di frequenze formantiche è stata spiegata in dettaglio,

l’esperimento non ha previsto un esplicito addestramento dei soggetti:

considerati i luoghi di svolgimento del test e la tipologia delle persone

coinvolte, si è ritenuto opportuno non far precedere l’esperimento da

sessioni di prova e di familiarizzazione con le singole batterie. Il

mancato addestramento è tuttavia un elemento da considerare nella

valutazione dei risultati: almeno nella discriminazione delle frequenze

formantiche (Kewley-Port 2001), indagini sperimentali hanno

evidenziato la non piccola rilevanza di questo fattore20. Inoltre,

sarebbe necessario prendere in debita considerazione l’esistenza di

strategie squisitamente individuali e altamente variabili nei compiti di

carattere uditivo (Johnson et al. 1987; Makashay 2003), nonostante

molte indagini di psicolinguistica tendano a considerare la categoria

degli ascoltatori cosiddetti ‘normali’ come una categoria omogenea. In

più, il materiale utilizzato e l’architettura sperimentale adottata sono in

grado di influenzare sia le risposte, sia il processo di categorizzazione

dell’ascoltatore (Cutugno & Savy 1996): un paradigma a risposte

forzate pone vincoli e limiti che spingerebbero a ripetere il test in una

diversa condizione sperimentale, con una differente strutturazione del

questionario, provando a costruire paradigmi di risposte libere o

parzialmente libere. Infine, sono ancora pochissime le indagini che

hanno per oggetto le differenze che intercorrono tra la percezione di l’andamento della frequenza fondamentale ha una importanza non secondaria (Pisoni 1976).

76

suoni in condizioni ottimali di ascolto e la percezione di suoni in

condizioni ‘normali’ di ascolto21: il laboratorio linguistico di una

scuola superiore non è una camera silente, né una piazza animata in un

giorno di mercato, e anche da questo punto di vista, dunque, la nostra

indagine si colloca in un territorio di confine, di cui si dovrà tenere

conto in fase di ampliamento della ricerca.

Gli ‘oggetti’ manipolati nell’esperimento sono alcune vocali toniche,

nei loro attributi frequenziali (prima e seconda formante) e nei loro

attributi temporali (durata): l’indagine si è concentrata sulle vocali

bandiera // e // e (limitatamente alle parole isolate) sulla vocale /a/22.

Negli stimoli di parlato letto, i fenomeni sotto osservazione sono sia i

cambiamenti timbrici, sia i cambiamenti nella durata; in quelli di

parlato semispontaneo, l’indagine si è concentrata esclusivamente

sulla percezione di cambiamenti temporali. Le batterie di stimoli sono

state realizzate con il programma Analysis-Synthesis Laboratory

(ASL) della Kay Elemetrics23 e sono state sottoposte ai soggetti tramite

il programma Meds 2002 (Music Experiment Development System), in

ordine casuale e intervallate da un suono sintetico (beep). A titolo

esemplificativo, in Tabb. 2-4 sono riportati alcuni stimoli, sia per le

modifiche in altezza vocalica, sia per le modifiche in durata,

20 Sull’addestramento dei soggetti si soffermano anche Clopper & Pisoni (2005: 328-329). 21 Un primo esperimento in tal senso è l’indagine di Kewley-Port & Zheng (1999), incentrata sulla percezione delle frequenze formantiche. 22 Sono in corso di somministrazione sessioni sperimentali che prendono in considerazione anche le altre vocali. 23 I dettagli delle modifiche sono descritti in §§ 5.1 e 5.2.

77

relativamente a una entrata di parlato letto e a una frase di parlato

semispontaneo.

F1 File Audio

1° originale originale.mp3

2° +100 Hz +100 Hz.mp3

3° +150 Hz +150 Hz.mp3

4° +200 Hz +200 Hz.mp3

Tab.2 Modifiche frequenziali sulla parola esplodere.

durata File Audio


2° +20% +20%.mp3

3° +50% +50%.mp3

4° -50% -50%.mp3

Tab.3 Modifiche temporali sulla parola esplodere.

78

durata File Audio


2° +50% +50%.mp3

3° -50% -50%.mp3

Tab.4 Modifiche temporali sulla frase Sì, verso la destra sì.

Nei due riquadri viene riportato un estratto dal questionario,

esattamente nella forma in cui è stato sottoposto agli studenti.

4) Ora sentirai alcune parole (esplodere, perfetto, calco) ripetute più volte (sono pronunciate da persone differenti). Prova a dire da quale città provengono le persone che pronunciano queste parole facendo la crocetta sulla località che ti sembra più pertinente I. esplodere: esplodere1 Pisa Livorno Firenze esplodere2 Pisa Livorno Firenze esplodere3 Pisa Livorno Firenze esplodere4 Pisa Livorno Firenze esplodere5 Pisa Livorno Firenze esplodere6 Pisa Livorno Firenze esplodere7 Pisa Livorno Firenze

Ora ascolterai alcune frasi di persone che provengono da varie parti della Toscana: devi decidere qual è la loro città di provenienza 1) La frase che sentirai per tre volte, pronunciata da persone diverse, è:

Sì, verso la destra, sì. (Le persone rispondono alla domanda: Devo andare verso la destra?). Le registrazioni sono state fatte per strada, c’è un po’ di rumore.....

1) Pisa Livorno Firenze 2) Pisa Livorno Firenze 3) Pisa Livorno Firenze

79

Come mostrano i due esempi, i soggetti hanno creduto di ascoltare

stimoli provenienti da parlanti differenti: a queste ‘diverse’ voci

dovevano attribuire la provenienza, scegliendo fra le tre città di Pisa,

Firenze e Livorno24.

5. Risultati

All’interno della cosiddetta Informal Literature, nelle descrizioni più

o meno impressionistiche delle varietà di Firenze, di Pisa e di Livorno,

non sono rari i riferimenti relativi alla maggiore o minore durata dei

segmenti25. Ad esempio, della “molta velocità del parlato fiorentino”

scrive il grammatico Girolamo Rosasco in un passo del VII dialogo

Della lingua toscana (1777: 750):

Passiamo ora ad esaminare i difetti da voi notati. Dite che i Fiorentini parlano con molta velocità. [...] Né so per qual ragione si abbia a fare in un tempo più lungo un’azione, che si può fare in più breve; conciossiaché quel tempo di più, che utilmente si spende, pare che ozio si possa chiamare, e in conseguenza difetto. E in che cosa s’ha egli ad impiegare quel tempo di più in parlando, se non in qualche cadenza, cantilena, o strascico di parole?

Sulla cantilena e sulla lentezza del pisano si soffermano Zuccagni

Orlandini (1864: 274), Sanminiatelli (1972: 50-51), Panzini (1919:

313); sulla lentezza e sulla cantilena del livornese scrivono, tra gli

altri, Micheli (1897: 6-7) e Marchi (1993: 62). Anche in Calamai

(2002) la “lentezza” risulta essere uno degli attributi più ricorrenti

24 I soggetti hanno udito ogni stimolo una sola volta. Siamo coscienti che questa procedura sperimentale non è esente da critiche, come si rileva in Clopper & Pisoni (2005: 321): se il test non fosse avvenuto all’interno di scuole superiori, con una tempistica relativamente rigida, sarebbe stato preferibile consentire ai soggetti di ascoltare ripetutamente i singoli stimoli. 25 Una rassegna è in Calamai (2004a).

80

nella descrizione della varietà livornese: “Le parole si pronunciano

lentamente enfatizzando su alcune di queste e [la cadenza] è aperta e

chiassosa”; “La cadenza è più lenta e si sofferma più sulle vocali”;

“La cadenza è blanda, ci soffermiamo molto sulle vocali”26.

Ugualmente, le vocali medie – e in particolare // – sono giudicate più

aperte, a Pisa più che a Firenze, e a Livorno più che a Pisa.

Nei §§ 5.1 e 5.2 vedremo allora se queste valutazioni per così dire

‘ingenue’ sono confermate anche da una analisi condotta con la

tecnica matched-guise. Per entrambi gli stili di parlato, sono

commentati sia i risultati suddivisi per scuola, sia i risultati

complessivi, in modo da evidenziare possibili tendenze generali.

Negli istogrammi sono riportati i valori percentuali del campione; le

frequenze complessive sono state sottoposte anche a una verifica

statistica mediante il test del χ2, in grado di fornire una misura

dell’adattamento tra la distribuzione teorica e la distribuzione

empirica27.

26 Sarebbero da indagare dettagliatamente quali siano i tratti legati alla personalità del parlante associati alla maggiore o minore lentezza d’eloquio; esperimenti condotti con parlato sintetico hanno mostrato come l’attribuzione di tratti psicologici quali ‘competenza’ e ‘benevolenza’ siano direttamente collegati alla manipolazione delle velocità: una maggiore competenza del parlante (e una sua minore benevolenza) è associata all’aumento della velocità d’eloquio (Brown, Strong & Rencher 1974; Smith et alii 1975). Sull’area oggetto d’indagine, l’ultima sezione del questionario fornirà alcuni dati in proposito. 27 Il test si basa sul confronto tra frequenze osservate (sul campione) e frequenze attese sulla base dell’ipotesi nulla che prevede un’equidistribuzione delle risposte. La conferma statistica dell’ipotesi alternativa (ovvero: frequenze diverse nelle tre città) non consente tuttavia di specificare ulteriormente l’ipotesi: in altre parole, non è possibile stabilire quale delle tre città abbia influito maggiormente all’interno dell’analisi, pur essendo il peso di ciascuna individuabile, almeno in parte, sulla base delle mere frequenze. La soglia di significatività è stata fissata al 5%.

81

5.1 Parlato letto

Sono state modificate tre parole prodotte in isolamento da un locutore

fiorentino proveniente dal corpus AVIP-API: esplodere, perfetto,

calco28. La vocale tonica dei tre stimoli – giudicati piuttosto neutri per

quanto concerne la resa dialettale – è stata dimezzata del 50% ed è

stata allungata del 20% e del 50%. Per le vocali toniche medio-basse,

il tracciato della prima formante è stato aumentato di 100 Hz, di 150

Hz, di 200 Hz. Per quanto concerne la vocale bassa, sono state

modificate sia la prima che la seconda formante29: nel primo caso, il

tracciato di F1 è stato diminuito di 50 Hz, mentre il tracciato di F2 è

stato diminuito di 100 Hz; nel secondo stimolo modificato, il tracciato

di F1 è stato diminuito di 100 Hz, e il tracciato di F2 è stato diminuito

di 200 Hz. Per ciascuna parola la batteria è stata presentata secondo

sequenze casuali.

In § 5.1.1 sono presentati i risultati in percentuale relativi alle risposte

degli studenti per quanto riguarda i tracciati formantici; in § 5.1.2 i

risultati relativi alle modifiche in durata per le tre vocali.

28 Riportiamo di seguito i valori originali, di frequenza e di durata. Esplodere: F1 515 Hz, F2 935 Hz, F3 2902 Hz, F4 3649 Hz, f0 140 Hz, durata 161 ms; perfetto: F1 449 Hz, F2 1924 Hz, F3 2459 Hz, F4 3465 Hz, f0 142 Hz, durata 114 ms; calco: F1 809 Hz, F2 1268 Hz, F3 2380 Hz, F4 3371 Hz, f0 146 Hz, durata 134 ms. In questa prima fase della ricerca, le variabili ‘lunghezza della parola’, ‘struttura sillabica’, ‘struttura accentuale’ non sono state controllate. 29 In area occidentale la vocale bassa è realizzata come vocale posteriore: è stato dunque necessario intervenire su entrambe le formanti.

82

5.1.1 Modifiche in frequenza

Vocale //

Le Figg.1-3 riportano i valori percentuali suddivisi per località; la

Fig.4 i risultati globali. A Firenze e a Pisa lo stimolo originale è

avvertito come facente parte della propria varietà (fiorentino a

Firenze, pisano a Pisa); a Livorno l’originale è etichettato come

fiorentino. Nelle tre località il cambiamento nell’attribuzione della

provenienza avviene quando lo stimolo aumenta di 200 Hz.

0

20

40

60

80

100

originale F1 +100 F1 +150 F1 +200

Livorno

Pisa

Firenze

0

20

40

60

80

100

originale F1 +100 F1 +150 F1 +200

LivornoPisaFirenze

Fig.1 Scuola di Firenze Fig.2 Scuola di Pisa

0

20

40

60

80

100

originale F1 +100 F1 +150 F1 +200

Livorno

Pisa

Firenze

0

20

40

60

80

100

originale F1 +100 F1 +150 F1 +200

Livorno

Pisa

Firenze

Fig.3 Scuola di Livorno Fig.4 Valori complessivi

83

La Fig.4 mostra come l’aumento dei valori della prima formante porti

a percepire lo stimolo come ‘non fiorentino’30.

Vocale //


Fig.8 i risultati globali: il quadro che emerge dai risultati relativi alla

vocale ‘bandiera’ per eccellenza è parzialmente differente rispetto a

quanto è stato osservato per la vocale posteriore. Nei dati fiorentini ci

sono due ‘salti’ di località: il primo poco facilmente spiegabile, dal

momento che l’originale è classificato come pisano e che l’aumento di

100 e di 150 Hz porta a classificare i due stimoli come fiorentini; il

secondo atteso, poiché individua nello stimolo con // aumentata di

200 Hz una provenienza livornese. Nelle scuole di Pisa e di Livorno il

‘salto’ di località avviene subito a 100 Hz: i due stimoli superiori a

questa soglia sono etichettati a Pisa come pisani e a Livorno come

livornesi.

30 La distribuzione è statisticamente significativa per lo stimolo con l’aumento di 100 Hz (χ2 critico 6,266; p. 0,004) e per lo stimolo con l’aumento di 200 Hz (χ2

critico 14,681; p. 0,001).

84

0

20

40

60

80

100

originale F1 +100 F1 +150 F1 +200

LivornoPisaFirenze

0

20

40

60

80

100

originale F1 +100 F1 +150 F1 +200

LivornoPisaFirenze


0

20

40

60

80

100

originale F1 +100 F1 +150 F1 +200

LivornoPisaFirenze

0

20

40

60

80

100

originale F1 +100 F1 +150 F1 +200

Livorno

Pisa

Firenze


Come per //, l’aumento della prima formante fa sì che lo stimolo sia

percepito come livornese31. La differenza rispetto alla vocale

posteriore sta nel giudizio attributo allo stimolo originale, ritenuto

pisano nelle scuole di Firenze e di Livorno. Per la vocale // le

percentuali complessive mostrano che basta un aumento di 100 Hz per

etichettare lo stimolo come livornese (per la vocale //, invece, questa

categorizzazione avviene, nel campione complessivo, a 150 Hz).

31 La distribuzione è statisticamente significativa per lo stimolo originale (χ2 critico 15,009; p. 0,001) e per lo stimolo con l’aumento di 150 Hz (χ2 critico 8,649; p. 0,013).

85

Vocale /a/

I valori percentuali suddivisi per località sono riportati nelle Figg. 9-

11; nella Fig.12 compaiono i risultati globali. Anche se i risultati

appaiono meno univoci, sono ugualmente rintracciabili linee di

tendenza32. Nel campione fiorentino lo stimolo è progressivamente

percepito come ‘meno fiorentino’ con l’aumento delle modifiche nei

tracciati formantici; nel campione pisano non si registra alcun effetto

relativo alla località di attribuzione; negli studenti livornesi lo stimolo

più posteriore è giudicato pisano, mentre gli altri due stimoli sono

reputati di provenienza livornese.

32 Il test del χ2 riporta esiti significativi solo per la distribuzione delle frequenze nel caso dello stimolo originale (χ2 critico 7,111; p. 0,029).

86

0

20

40

60

80

100

originale F1-50, F2-100 F1-100, F2-200

LivornoPisaFirenze

0

20

40

60

80

100

originale F1-50, F2-100 F1-100, F2-200

LivornoPisaFirenze


0

20

40

60

80

100

originale F1 -50, F2 -100 F1 -100, F2 -200

LivornoPisaFirenze

0

20

40

60

80

100

originale F1 -50 F2 -100 F1 -100 F2 -200

Livorno

Pisa

Firenze


Nel complesso, lo stimolo più posteriore è giudicato di provenienza

occidentale (pisana in primis, in secondo luogo livornese). Questa

risposta mostra una buona coincidenza tra produzione e percezione: la

velarizzazione di /a/ è un tratto che ritroviamo diffusamente nella

Toscana occidentale e non è fenomeno tipicamente livornese.

5.1.2 Modifiche in durata

A differenza di quanto è stato osservato per i tracciati formantici,

l’effetto del luogo di attribuzione risulta meno chiaro; nel complesso,

l’aumento di durata del 20% appare scarsamente percepibile.

87

Vocale //


Fig.16 i risultati globali. Nel campione fiorentino, l’aumento del 50%

porta a etichettare lo stimolo come pisano (ma lo scarto è comunque

minimo); nel campione pisano, l’aumento del 50% spinge a etichettare

lo stimolo come livornese; a Livorno la distribuzione delle percentuali

non mostra alcun effetto della località di attribuzione33.

0

20

40

60

80

100

originale V -50% V +20% V +50%

LivornoPisaFirenze

0

20

40

60

80

100


LivornoPisaFirenze


0

20

40

60

80

100


LivornoPisaFirenze

0

20

40

60

80

100


Livorno

Pisa

Firenze

Fig.15 Scuola di Livorno Fig.16 Percentuali complessive

33 È francamente inspiegabile il risultato relativo alla vocale abbreviata del 50%, percepita da molti soggetti come livornese. Forse la vocale modificata – che nella

88

La Fig.16 mostra come nella vocale tonica di esplodere l’aumento o la

diminuzione della durata non risulti essere legata a una località in

particolare34.

Vocale //

I valori percentuali suddivisi per località sono riportati nelle

Figg.17-19; i risultati globali nella Fig.20. Nel campione fiorentino e

in quello livornese non si evidenzia alcun effetto della località di

attribuzione; nel campione pisano si registra un ‘salto’ nello stimolo

allungato del 50%, etichettato come livornese da molti studenti.

sua versione ‘ridotta’ misura 80 ms – non è abbastanza breve per poter essere percepita come ‘non livornese’. 34 La distribuzione è statisticamente significativa soltanto per lo stimolo con la vocale tonica allungata del 20% (χ2 critico 7,905; p. 0,019).

89

0

20

40

60

80

100


LivornoPisaFirenze

0

20

40

60

80

100


LivornoPisaFirenze


0

20

40

60

80

100


LivornoPisaFirenze

0

20

40

60

80

100


Livorno

Pisa

Firenze


Come per //, i cambiamenti nella durata hanno una scarsa rilevanza

nell’attribuzione alla località di provenienza della voce35.

Vocale /a/


Fig.24 i risultati globali. L’effetto del fattore ‘luogo di attribuzione’ è

evidente nel campione pisano e in quello fiorentino, ove il ‘salto’ di

località avviene nello stimolo allungato del 50%, mentre non compare

nel campione livornese.

35 La distribuzione è statisticamente significativa per lo stimolo originale (χ2 critico 15,009; p. 0,001) e per lo stimolo con la vocale tonica allungata del 20% (χ2 critico 7,578; p. 0,023).

90

0

20

40

60

80

100


LivornoPisaFirenze

0

20

40

60

80

100


LivornoPisaFirenze


0

20

40

60

80

100


LivornoPisaFirenze

0

20

40

60

80

100


Livorno

Pisa

Firenze


Nel complesso, la vocale allungata del 50% risulta essere indice di

livornesità; specularmente, la vocale abbreviata del 50% ha la

percentuale più bassa di attribuzioni livornesi36.

Le distribuzioni percentuali relative ai cambiamenti formantici

risultano abbastanza chiare anche in una tipologia di parlato molto

controllata, come quella rappresentata dagli stimoli di parlato letto;

all’interno dello stesso materiale sonoro, i cambiamenti di durata

36 La distribuzione è statisticamente significativa per lo stimolo originale (χ2 critico 15,009; p. 0,030), per lo stimolo con la vocale tonica dimezzata del 50% (χ2 critico 15,774; p. 0,000) e per lo stimolo con la vocale tonica allungata del 50% (χ2 critico 17,829; p. 0,000).

91

sembrano essere al contrario meno strettamente legati alla variabile

diatopica. Anche per questa ragione è stata costruita una batteria di

stimoli di parlato semispontaneo (vd. § 5.2) che possa rappresentare

un utile raffronto.

Nel valutare i risultati provenienti dal parlato letto, non sarà forse da

ignorare una certa ‘resistenza’ del materiale sonoro di partenza,

rappresentato da un fiorentino piuttosto neutro, su cui sono stati

aggiunti fenomeni ‘non fiorentini’ (cfr. § 4): tra questi, in ogni caso,

sono le modifiche timbriche a essere più caratterizzate in senso

geografico.

5.2 Parlato semispontaneo: modifiche in durata

Per un confronto con quanto è emerso dagli stimoli di parlato letto,

sono state utilizzate tre frasi provenienti da parlato semispontaneo

(map tasks), prodotte da un locutore pisano37. Di ciascuna vengono

riportati, entro parentesi, i valori medi di F1, F2, la durata e

l’escursione in semitoni della vocale tonica poi modificata nei suoi

valori temporali:

a) Sì, verso la destra, sì… (F1 553, F2 1630, ms 173, ST 3,52)

b) Sì, la faccio a destra… (F1 587, F2 1645, ms 142, ST 1,4)

c) Tipo, non lo so, se ho fame, una pasticceria… (F1 583, F2

1112, ms 223, ST 2,95)

37 Il materiale sonoro proviene dal corpus AVIP: in particolare, si tratta dell’instruction follower della mappa A03 di Pisa.

92

Sono state prese in considerazione due frasi con la vocale // tonica

prominente che fossero formalmente confrontabili38, e che

presentassero una differenza consistente per quanto concerne i valori

di durata e di modulazione della frequenza fondamentale all’interno

del segmento vocalico poi sottoposto a modifica. In più, anche il

fattore ‘abbassamento vocalico’ è differente nelle due vocali toniche

sotto osservazione: il segmento più lungo e più modulata è meno

aperto, mentre il segmento più aperto è più breve e meno modulato39.

La vocale tonica delle parole destra e so è stata allungata e dimezzata

del 50%40. Ai soggetti è stato chiesto, al solito, di attribuire, per

ciascuna frase somministrata in sequenze casuali, la località di

provenienza, scegliendo tra Pisa, Firenze, Livorno.

Frase (a) Sì, verso la destra, sì…


Fig.28 i risultati globali. L’originale è giudicato livornese a Firenze,

pisano a Pisa e a Livorno. A Firenze e a Livorno lo stimolo con la

vocale tonica abbreviata è giudicato fiorentino, a Pisa è reputato

pisano.

38 In entrambi i casi viene modificata la vocale tonica di una stessa parola, finale di sintagma intonativo. I due enunciati sono comparabili anche per quanto riguarda la durata complessiva (1483 ms vs. 1033 ms.). 39 Per la prima formante, la differenza è di 34 Hz, valore superiore alla soglia indicata in Kewley-Port & Watson (1994) per la discriminazione di F1. La seconda formante, al contrario, ha in entrambi i casi un valore molto simile. 40 La vocale non è stata allungata del 20% poiché questo aumento percentuale ha prodotto risultati poco rilevanti nel caso di parlato letto (vd. § 5.1).

93

0

20

40

60

80

100

originale V +50% V -50%

LivornoPisaFirenze

0

20

40

60

80

100


LivornoPisaFirenze


0

20

40

60

80

100


LivornoPisaFirenze

0

20

40

60

80

100

orig ina le V +50% V -50%

Livorno

Pisa

Firenze


La frase originale è nel complesso reputata di provenienza non

fiorentina, la frase con la vocale tonica allungata è inequivocabilmente

reputata livornese, la frase con la vocale più breve è giudicata la meno

livornese di tutte (con una minima maggioranza di risposte

fiorentine)41.

Frase (b) Sì, la faccio a destra…

Le Fig.29-31 riportano i valori percentuali suddivisi per località; la

Fig.32 i risultati globali. Lo stimolo originale è giudicato pisano a

94

Firenze e a Pisa mentre nel campione livornese è giudicato soprattutto

fiorentino42.

0

20

40

60

80

100


LivornoPisaFirenze

0

20

40

60

80

100


LivornoPisaFirenze


0

20

40

60

80

100


LivornoPisaFirenze

0

20

40

60

80

100


Livorno

Pisa

Firenze


Il grafico in Fig.32 mostra un andamento simile a quello riportato in

Fig.28: in entrambi i casi, la maggiore lunghezza vocalica è indice di

livornesità. Rispetto a quanto viene rilevato per la frase (a), lo stimolo

originale risulta meno connotabile in senso geografico mentre lo

41 La distribuzione è statisticamente significativa per la frase con la vocale tonica allungata del 50% (χ2 critico 26,703; p. 0,000). 42 Per gli studenti di Livorno, evidentemente, manca ‘qualcosa’ che possa connotare la voce come inequivocabilmente livornese.

95

stimolo con la vocale tonica più breve ottiene un maggior numero di

risposte che lo individuano come fiorentino43.

Frase (c) Tipo, non lo so, se ho fame, una pasticceria…


Fig.36 i risultati globali. La frase originale è reputata livornese a

Firenze, pisana a Pisa, fiorentina a Livorno. Nelle risposte del

campione fiorentino non risulta evidente alcun effetto del luogo (la

maggioranza dei soggetti giudica fiorentina sia la vocale allungata, sia

la vocale abbreviata). L’allungamento vocalico è giudicato

inequivocabilmente livornese soltanto nel campione pisano.

43 La distribuzione è statisticamente significativa per la frase originale (χ2 critico 7,337; p. 0,026), per la frase con la vocale tonica allungata del 50% (χ2 critico 42,222; p. 0,000), per la frase con la vocale tonica dimezzata del 50% (χ2 critico 15,884; p. 0,000).

96

0

20

40

60

80

100


LivornoPisaFirenze

0

20

40

60

80

100


LivornoPisaFirenze


0

20

40

60

80

100


LivornoPisaFirenze

0

20

40

60

80

100


Livorno

Pisa

Firenze


I dati riportati in Fig.36 mostrano sì il carattere livornese

dell’allungamento vocalico, ma nel contempo evidenziano anche una

minore ‘riconoscibilità’ di //44.

6. Osservazioni conclusive

Sono stati manipolati sperimentalmente due tratti acustici – durata e

frequenze formantiche – all’interno di alcune vocali toniche:

l’attenzione si è concentrata sulle due vocali ‘bandiera’ per le varietà

44 La distribuzione è statisticamente significativa per la frase con la vocale tonica allungata del 50% (χ2 critico 6,266; p. 0,044).

97

di Pisa e di Livorno – // e // – e sulla vocale /a/. Sono state prese in

esame sia le distribuzione percentuale relativa a ciascuna delle tre

località, sia la distribuzione percentuale relativa alle risposte

complessive, queste ultime sottoposte anche a una analisi statistica:

sono state individuate alcune linee di tendenza comuni, all’interno di

un quadro in parte anche contraddittorio, che in qualche modo

potrebbe segnalare, da parte dell’ascoltatore, la difficoltà e il disagio

nei confronti di ciò che è avvertito “come puro stimolo fonico, o

semplice sequenza di suoni, non ancora immagine, tanto meno

segnale, privo come è di funzione comunicativa” (Romanello 2002:

294). Non è un caso che studiosi attivi nel campo della dialettologia

percettiva abbiano più volte sottolineato come nella tecnica matched-

guise sia implicita una ipersemplificazione di quell’attività che va

sotto il nome di ‘riconoscimento dialettale’ (Preston 1989: 3;

Williams, Garrett, Coupland 1999: 346-348).

Per i movimenti formantici all’interno delle vocali bandiera,

l’aumento di F1 è fattore sufficiente – anche in stimoli di parlato letto

– a etichettare lo stimolo come livornese, con una differenza legata al

timbro: per // la percezione della provenienza livornese avviene con

una modifica più piccola del valore frequenziale di partenza45. Per i

cambiamenti di durata, l’effetto del fattore ‘luogo di attribuzione’ è

nel parlato letto complessivamente di scarsa entità e ha spinto a

ripetere il test ricorrendo a materiali di parlato semispontaneo: in

45 Peraltro già inferiore rispetto a //: il valore originario di F1 in esplodere è – lo ricordiamo – 515 Hz mentre il valore originario di F1 in perfetto è 449 Hz.

98

questa modalità d’eloquio, all’interno di enunciati di una certa

lunghezza, l’individuazione della provenienza è naturalmente più

facile, in quanto il parlante può attingere in contemporanea a più

indici acustici.

Il quadro emerso dai grafici relativi al parlato semispontaneo può

dunque essere riassunto attraverso le seguenti osservazioni:

a) la maggiore durata della vocale tonica manipolata è quasi sempre

indice di livornesità;

b) la minore durata della vocale tonica manipolata non è indice di

fiorentinità a Pisa, lo è talvolta a Livorno, lo è sempre a Firenze;

c) // e // mostrano comportamenti simili per quanto riguarda le

reazioni relative alla maggiore durata a Pisa; sono meno chiari i

risultati per // (nella vocale tonica allungata) a Firenze e a Livorno;

d) nel parlato semispontaneo, // è vocale più ‘bandiera’ di //46.

La presenza di due frasi con la stessa parola bersaglio, caratterizzata

da differenti valori per quanto concerne la modulazione di f0 e la

durata, permette anche di avanzare qualche rilievo a proposito del

complesso rapporto che investe la modulazione, la durata e l’apertura

vocalica, anche se siamo consapevoli del fatto che tale rapporto potrà

e dovrà essere meglio indagato in futuro, con un opportuno disegno 46 Nel valutare questo risultato, non sarà da ignorare un limite del disegno sperimentale: la scarsa riconoscibilità di // potrebbe essere dovuta anche alla posizione della parola so nella frase, collocata in una struttura di inciso. In genere, le prestazioni dei soggetti nei compiti di identificazione e di discriminazione tendono a essere migliori quando lo stimolo target è in posizione finale rispetto a quando si trova in una posizione interna (Liu & Kewley-Port 2004: 1230). Ad ogni modo, per

99

sperimentale. Ad ogni modo, la lettura delle distribuzioni percentuali

mostra le tendenze seguenti:

a) a Pisa la frase-stimolo originale con // più modulata e più lunga

(ma meno aperta) è giudicata più pisana della frase-stimolo originale

con // più aperta (ma meno modulata e più breve);

b) a Firenze la frase-stimolo originale con // più modulata e più

lunga (ma meno aperta) è giudicata più livornese della frase-stimolo

originale con // più aperta (ma meno modulata e più breve), che è

stata attribuita con percentuali più o meno simili a Pisa e a Firenze;

c) a Livorno la frase-stimolo originale con // più aperta (ma meno

modulata e più breve) è attribuita alla varietà di Firenze.

Ci potremmo chiedere allora se l’apporto comune di una più estesa

modulazione di f0 e di una maggiore durata possa rappresentare un

indice più potente degli abbassamenti vocalici per quanto concerne

l’identificazione della provenienza del parlante47. Per verificare questa

ipotesi sarà necessario estendere l’analisi anche a quei foni vocalici

che non risultano essere marcati nelle varietà pisana e livornese e,

soprattutto, costruire batterie sperimentali opportune, in cui siano

sistematicamente modificate f0 e durata. Nell’esperimento qui

la percezione della durata, gli studi rivelano una tendenza opposta, cui si fa cenno in § 4. 47 Questo primo risultato spingerebbe anche a fare qualche speculazione sulla priorità di indici prosodici rispetto a quelli segmentali nei compiti di riconoscimento: del resto è noto come le caratteristiche prosodiche siano il primo tratto fonetico che viene acquisito dal bambino (Crystal 1973), e come i parlanti siano in grado di riconoscere le lingue sulla base della sola prosodia (Ohala & Gilbert 1981).

100

descritto è stata manipolata una sola variabile alla volta, con una

notevole forzatura rispetto a quanto avviene nel parlato reale: la tappa

successiva del lavoro riguarderà la modifica di più variabili in

contemporanea. Proprio in questa direzione si muoveranno le nostre

indagini future, che intenderanno prendere in esame anche soggetti di

età differente, per valutare se campioni diversificati per età possano,

‘dalla parte del ricevente’, offrire prove relative a un sound change in

corso: dal momento che i fenomeni sotto osservazione hanno anche

una loro peculiarità diastratica, è possibile ipotizzare che soggetti

anziani di località ove la frattura giovani vs. anziani è nel vocalismo

particolarmente marcata (ad esempio a Pisa o a Cecina) reagiscano in

maniera differente rispetto a soggetti anziani di località ove tale

frattura è assente o rispetto a soggetti giovani che ricorrono a certi

andamenti formantici e prosodici anche per segnalare e ribadire la

propria peculiare identità48.

SILVIA CALAMAI & IRENE RICCI

Laboratorio di Linguistica, Scuola Normale Superiore, Pisa

[email protected]; [email protected]

48 Vd. a questo proposito Janson (1983; 1986).

101

Bibliografia Antonini F., Moretti, B. (2000) Le immagini dell’italiano regionale, Osservatorio

linguistico della Svizzera Italiana, Locarno: Dadò. Baroni, M.R. (1983) Il linguaggio trasparente. Indagine psicolinguistica su chi

parla e chi ascolta, Bologna: Il Mulino. Berruto, G. (1995) Fondamenti di sociolinguistica, Roma-Bari: Laterza. Berruto, G. (2002) Sul significato della dialettologia percettiva per la linguistica e la

sociolinguistica. In Atti del Convegno Internazionale Che cosa ne pensa oggi Chiaffredo Roux? Percorsi della dialettologia percettiva all’alba del nuovo millennio (M. Cini & R. Regis, a cura di), Bardonecchia, 25-27.V.2000, Alessandria: Edizioni dell’Orso, 341-360.

Brigato, S., Marotta, G. (2002) La modalità imperativa nell’italiano di Lucca. Prime linee di tendenza. In La fonetica acustica come strumento di analisi della variazione linguistica in Italia. Atti delle XIIe Giornate di Studio del GFS (in A. Regnicoli, a cura di), Macerata, 13-15.XII.2001, Roma: Il Calamo, 111-116.

Brown, B.L., Strong, W.J., Rencher, A.C. (1974) Fifty four voices from two: The effects of simultaneous manipulations of rate, mean fundamental frequency, and variance of fundamental frequency on ratings of personality from speech, JASA, 55, 313-18.

Calamai, S. (2001) Stili a confronto nel parlato toscano (Pisa e Firenze), L’Italia Dialettale, 2004, 62, 95-125.

Calamai, S. (2002) La percezione al quadrato in Toscana: pisani e livornesi. In Atti del Convegno Internazionale Che cosa ne pensa oggi Chiaffredo Roux? Percorsi della dialettologia percettiva all’alba del nuovo millennio (M. Cini & R. Regis, a cura di), Bardonecchia, 25-27.V.2000, Alessandria: Edizioni dell’Orso, 139-171.

Calamai, S. (2004a) Il vocalismo tonico pisano e livornese. Aspetti storici, percettivi, acustici, Alessandria: Edizioni dell’Orso.

Calamai, S. (2004b) Vocali fiorentine e vocali pisane a confronto. In Il parlato Italiano. Atti del Convegno Nazionale (F. Albano Leoni, F. Cutugno, M. Pettorino, R. Savy, a cura di), Napoli, 13-15.II.2003, Napoli: D’Auria, CD-rom, E02, 1-25.

Calamai, S., Ricci, I. (in stampa) Sulla percezione dei confini vocalici in Toscana: primi risultati. In Misura dei parametri. Atti del I convegno nazionale AISV (P. Cosi, a cura di), Padova, 2-4.XII.2004.

Calamai, S. (in prep.) Confini e atteggiamenti linguistici in Toscana. Canepari, L. (1999²) Manuale di pronuncia italiana, Bologna: Zanichelli. Cardona, G.R. (1988) Dizionario di linguistica, Roma: Armando. Carlson, R., Granström, B. (1975) Perception of segmental duration. In Structure

and process in speech perception (A. Cohen & S.G. Nooteboom, editors), Heidelberg: Springer-Verlag, 90-104.

Cini, M., Regis, R. (2002) (a cura di) Atti del Convegno Internazionale Che cosa ne pensa oggi Chiaffredo Roux? Percorsi della dialettologia percettiva all’alba del nuovo millennio, Bardonecchia, 25-27.V.2000, Alessandria: Edizioni dell’Orso.

102

Clopper, C.G., Pisoni, D.B. (2005) Perception of dialect variation. In The handbook of speech perception (D.B. Pisoni & R.E. Remez, editors), Oxford & Malden, Mass.: Blackwell, 313-337.

Crystal, D. (1973) Non-segmental phonology in language acquisition: A review of the issues, Lingua, 32: 1-45.

Cutugno, F., Savy, R. (1996) Percezione e categorizzazione di foni vocalici: adeguatezza delle procedure sperimentali. In Atti del XXIV Convegno Nazionale AIA (A. Peretti & P. Simonetti, a cura di), Trento, 12-14.VI.1996, Padova: Arti Grafiche Padovane, 179-182.

Dell’Aglio, M., Bertinetto, P.M., Agonigi, M. (2002) Le durate dei foni vocalici in rapporto al contesto nel parlato di locutori pisani: primi risultati. In La fonetica acustica come strumento di analisi della variazione linguistica in Italia. Atti delle XIIe Giornate di Studio del GFS (A. Regnicoli, a cura di), Macerata, 13-15.XII.2001, Roma: Il Calamo, 53-58.

Dell’Aglio, M. (2003) Ancora sulla durata vocalica in pisano. In La coarticolazione. Atti delle XIIIe Giornate di Studio del GFS (G. Marotta & N. Nocchi, a cura di), Pisa: ETS, 287- 294.

Dell’Aglio, M. (2004) Spunti sulla durata consonantica in pisano. In Costituzione, gestione e restauro di corpora vocali. Atti delle XIVe Giornate di Studio del GFS (A. De Dominicis, L. Mori, M. Stefani, a cura di), Università della Tuscia (Viterbo), 4-6.XII.2003, Roma: Esagrafica, 159-164.

Flanagan, J.L. (1955) A difference limen for vowel formant frequency, JASA, 27, 613-617.

Flanagan, J.L. (1957) Estimates of the maximum precision necessary in quantizing certain ‘dimension’ of vowel sounds, JASA, 29, 533-534.

Ganong, W.F. (1980) Phonetic categorization in auditory word perception, Journal of Experimental Psychology: Human Perception and Performance, 6, 110-125.

Gili Fivela, B. (2004) Phonetics and phonology intonation: The case of Pisa Italian, Tesi di Perfezionamento, Scuola Normale Superiore, Pisa.

Graff, D., Labov, W., Harris, W.A. (1986) Testing listeners’ reactions to phonological markers of ethnic identity: A new method for sociolinguistic research”. In Diversity and diachrony (D. Sankoff, editor), Amsterdam / Philadelphia: Benjamins, 45-58.

Huggins, A.W.F. (1972) Just noticeable differences for segment duration in natural speech, JASA, 51, 1270-1278.

Janson, T. (1983) Sound change in perception and production, Language, 59: 18-34. Janson, T. (1986) Sound change in perception: An experiment. In Experimental

phonology (J.J. Ohala, J.J. Jaeger, editors), Orlando Florida: Academic Press, 253-260.

Johnson, D.M., Watson, C.S., Jensen, J.K. (1987) Individual differences in auditory capabilities, JASA, 81, 427-438.

Kewley-Port, D. (2001) Vowel formant discrimination II: Effects of stimulus uncertainty, consonantal context, and training, JASA, 110, 2141-2155.

Kewley-Port, D., Watson C.S. (1994) Formant-frequency discrimination for isolated english vowels, JASA, 95, 485-496.

103

Kewley-Port, D., Zheng, Y. (1999) Vowel formant discrimination: Towards more ordinary listening conditions, JASA, 106, 2945-2958.

Klatt, D.H. (1976) Linguistic uses of segmental duration in English: Acoustic and perceptual evidence, JASA, 59, 1208-1221.

Klatt, D.H., Cooper, W.E. (1975) Perception of segmental duration in sentence context. In Structure and process in speech perception (A. Cohen & S.G. Nooteboom, editors), Heidelberg: Springer-Verlag, 69-86.

Ladefoged, P. (1984) ‘Out of chaos comes order’; Physical, biological, and structural patterns in phonetics. In Proceedings of the 10th International Congress of Phonetic Sciences (M.P.R. Van den Broecke & A. Cohen, editors), Dordrecht: Foris, 83-95.

Lehiste, I. (1970) Suprasegmentals, Cambridge Mass.: The MIT Press. Liu, C. & Kewley-Port, D. (2000), Vowel formant discrimination in natural speech,

JASA, 108, 2601. Makashay, M.J. (2003) Individual differences in speech and non-speech perception

of frequency and duration, PhD Dissertation, The Ohio State University. Marchi, V. (1993) Lessico del livornese. Con finestra aperta sul bagitto, Livorno,

Belforte. Marotta, G. (2001) Non solo spiranti. La ‘gorgia toscana’ nel parlato di Pisa, L’Italia

Dialettale, LXII, 27-60. Marotta, G. (2002) L’intonation des énoncées interrogatifs ouverts dans l’italien

toscan. In Proceedings of speech prosody, Aix-en-Provence, April 2002, 475-478.

Marotta, G., Nocchi, N. (2001) La liquida laterale nel livornese, Rivista Italiana di Dialettologia, 25, 285-326.

Marotta, G., Sorianello, P. (2001) La teoria autosegmentale nell’analisi dell’intonazione interrogativa in due varietà di italiano toscano (Lucca e Siena). In Dati empirici e teorie linguistiche. Atti del XXXIII Congresso SLI (F. Albano Leoni et al., a cura di), Napoli, 28-30.X.1999, Roma: Bulzoni, 177-204.

Marotta, G., Bertoni, E., Franceschi, R., Giuliani, M., Sorianello, P. (2002) Le occlusive sorde dell'italiano parlato a Pisa: varianti aspirate e fricative. In La fonetica acustica come strumento di analisi della variazione linguistica in Italia. Atti delle XXIIe Giornate di Studio del GFS (A. Regnicoli, a cura di), Roma: Il Calamo, 71-76.

Marotta, G., Sardelli, E. (2003) Sulla prosodia della domanda con soggetto postverbale in due varietà di italiano toscano. In Voce, canto, parlato. Studi in ricordo di F. Ferrero (P. Cosi et al., a cura di), Padova: Unipress, 205-212.

Marotta, G., Calamai, S., Sardelli, E. (2004) Non di sola lunghezza. La modulazione di f0 come indice sociofonetico. In Costituzione, gestione e restauro di corpora vocali. Atti delle XIVe Giornate di Studio del GFS (A. De Dominicis, L. Mori, M. Stefani, a cura di), Università della Tuscia (Viterbo), 4-6.XII.2003, Roma: Esagrafica, 215-220.

Mermelstein, P. (1978) Difference limens for formant frequencies of steady-state and consonant-bound vowels, JASA, 63, 572-580.

Micheli, P. (1897) Due poeti vernacoli livornesi, Conegliano: Cagnani.

104

Niedzielski, N. (1995) Acoustics analysis and language attitudes in Detroit. In (N)Waves and means (M. Meyerhoff, editor), University of Pennsylvania Working Papers in Linguistics, 3, 1, 73-86.

Niedzielski, N. (1999) The effects of social information on the perception of sociolinguistic variables, Journal of language and social psychology, 18, 1, 62-85.

Nocchi, N. (2002) Varianti della laterale nell’italiano di Livorno. In La fonetica acustica come strumento di analisi della variazione linguistica in Italia. Atti delle XIIe Giornate di Studio del GFS (A. Regnicoli, a cura di), Macerata, 13-15.XII.2001, Roma: Il Calamo, 77-82.

Nocchi, N. (2003) Vesto vì: un processo di rafforzamento in livornese?. In La coarticolazione. Atti delle XIIIe Giornate del GFS (G. Marotta & N. Nocchi, a cura di), Pisa: ETS, 221-232.

Nocchi, N. (2004) Laterali rafforzate e velarizzate? Ancora sulla velarizzazione della liquida laterale in livornese. In Costituzione, gestione e restauro di corpora vocali. Atti delle XIVe Giornate di Studio del GFS (A. De Dominicis, L. Mori, M. Stefani, a cura di), Università della Tuscia (Viterbo), 4-6.XII.2003, Roma: Esagrafica, 177-182.

Ohala, J.J., Gilbert, J.B. (1981) Listener ability to identify language by their prosody. In Problèmes de prosodie I (P.R. Léon, M. Rossi, ed.), Ottawa: Didier.

O’Shaughnessy, D. (1987) Speech communication. Human and machine, Reading etc.: Addison-Wesley.

Panzini, A. (1920 [1919]) Viaggio di un povero letterato, Milano: Treves. Pisoni, D.B. (1976) Fundamental frequency and perceived vowel duration, JASA,

59: S39. Preston, D.R. (1989) Perceptual dialectology, Dordrecht: Foris. Preston, D.R. (1997) The Northern Cities Chain Shift in your mind. In Issues and

methods in dialectology (A. Thomas, editor), Bangor, Wales: Department of Linguistics, University of Wales, Bangor, 37-45.

Preston, D.R. (in stampa) Dialects across internal frontiers: Some cognitive boundaries. In Proceedings of the XI international conference on methods in dialectology.

Ryan, E.B., Giles, H., Hewstone M. (1988) The measurements of language attitudes. In Sociolinguistics/Soziolinguistics (H.V.U. Ammon, N. Dittmar, K.J. Mattheier, editors), Berlin: de Gruyter, 1068-81.

Romanello, M.T. (2002) Sentire parole / percepire varietà. In Atti del convegno internazionale Che cosa ne pensa oggi Chiaffredo Roux? Percorsi della dialettologia percettiva all’alba del nuovo millennio (M. Cini & R. Regis, a cura di), Bardonecchia, 25-27.V.2000, Alessandria: Edizioni dell’Orso, 283-297.

Rosasco, G. (1777) Della lingua toscana dialoghi sette, Torino: Stamperia Reale. Sanminiatelli, B. (1972) Pisa e la sua terra, Pisa: Giardini. Smith, B.L., Brown, B.L., Strong, W.J., Rencher, A.C. (1975) Effects of speech rate

on personality perception, Language and Speech, 18: 145-152. Sorianello, P. (2001) Per una rappresentazione uditiva dei segmenti vocalici: il caso

del senese, Quaderni del Laboratorio di Linguistica della Scuola Normale Superiore, 2 (Nuova Serie), 159-173.

105

Sorianello, P. (2002) Il vocalismo dell’italiano senese: un’indagine sperimentale. In La fonetica acustica come strumento di analisi della variazione linguistica in Italia. Atti delle XIIe Giornate di Studio del GFS (A. Regnicoli, a cura di), Macerata, 13-15.XII.2001, Roma: Il Calamo, 47-52.

Thomas, E.R. (2002) Instrumental phonetics. In The handbook of language variation and change (J.K. Chambers, P. Trudgill, N. Schilling-Estes, editors), Oxford & Malden, Mass.: Blackwell, 168-200.

Turchi, L., Bertinetto, P.M. (2000) La durata vocalica di fronte ai nessi /sC/: un’indagine su soggetti pisani”, Studi Italiani di Linguistica Teorica e Applicata, 29, 3, 389-421.

Volkart-Rey, R. (1990) Atteggiamenti linguistici e stratificazione sociale. La percezione dello status sociale attraverso la pronuncia. Indagine empirica a Catania e a Roma, Roma: Bonacci.

Williams, A., Garrett, P., Coupland, N. (1999) Dialect recognition. In Handbook of perceptual dialectology (D.R. Preston, editors), Amsterdam/Philadelphia: Benjamins, I, 345-358.

Zuccagni Orlandini, A. (1864) Raccolta di dialetti italiani con illustrazioni etnologiche, Firenze: Tofani.

UN ESPERIMENTO DI MATCHED GUISE IN TOSCANA · sposa bene con la tradizionale sociolinguistica...

Documents

Transcript of UN ESPERIMENTO DI MATCHED GUISE IN TOSCANA · sposa bene con la tradizionale sociolinguistica...