UN ESPERIMENTO DI MATCHED GUISE IN TOSCANA · sposa bene con la tradizionale sociolinguistica...
-
Upload
nguyenquynh -
Category
Documents
-
view
222 -
download
1
Transcript of UN ESPERIMENTO DI MATCHED GUISE IN TOSCANA · sposa bene con la tradizionale sociolinguistica...
UN ESPERIMENTO DI MATCHED-GUISE IN TOSCANA
SILVIA CALAMAI & IRENE RICCI∗
“L’idea che per raggiungere la chiarezza su un termine generale si debba trovare l’elemento comune a tutte le sue applicazioni ha messo in gabbia la ricerca filosofica perché non solo non ha portato a nessun risultato, ma ha anche indotto il filosofo a giudicare irrilevanti i casi concreti, i quali soli avrebbero potuto aiutarlo a comprendere l’uso del termine generale” (L. Wittgenstein, Libro blu e libro marrone)
1. Dalla produzione all’ascolto
Grazie alla sintesi vocale è possibile costruire esperimenti percettivi in
cui, sotto il diretto controllo del ricercatore, vengono modificati nella
catena sonora soltanto certi attributi fonetici; siffatte variazioni,
calibrate sperimentalmente, consentono anche di meglio individuare
quali caratteristiche fonetiche siano sfruttate dai parlanti come segnali
di appartenenza diatopica. Come viene suggerito efficacemente in
Preston (in stampa), con la sintesi vocale le ricerche dialettologiche
possono in qualche modo arginare i difetti di analisi relativi alla
percezione sonora (ciò che si ascolta è davvero ciò che viene
acusticamente prodotto?), mentre gli studi sulle attitudini linguistiche
possono essere in parte tutelati da errori relativi alla produzione (si
∗ La redazione scritta dell’articolo è opera di Silvia Calamai. La parte sperimentale del lavoro è stata curata da entrambe le autrici; la parte statistica è stata svolta da Irene Ricci. Un ringraziamento sentito va alle tre scuole superiori coinvolte nell’esperimento (Istituto Tecnico Agrario di Firenze, ITIS “Leonardo da Vinci” di Pisa, Istituto Tecnico Statale Commerciale e per Programmatori “A. Vespucci – P. Calamandrei” di Livorno) e ai docenti che nel periodo settembre-novembre 2004 hanno reso possibili gli incontri con gli studenti. Il percorso di ricerca qui delineato ha potuto beneficiare di osservazioni preziose da parte di Pier Marco Bertinetto, Giovanna Marotta e Rosanna Sornicola.
64
reagisce alle voci giudicate differenti o si reagisce a particolari tratti
fonetici indirettamente veicolati da queste voci?).
L’area toscana è abbastanza coperta per quanto concerne gli studi
acustici, e può a nostro avviso rappresentare un buon laboratorio di
analisi per ricerche costruite in chiave sociofonetica (Thomas 2002:
189-190; Clopper & Pisoni 2005: 328), che prendano in esame anche
aspetti di tipo percettivo1: sappiamo (o cominciamo a sapere) come i
parlanti adoperano certe variabili ma abbiamo pochissime
informazioni su come queste variabili siano interpretate dagli
ascoltatori.
L’indagine qui presentata ha pertanto un carattere esplorativo: fa
tesoro delle conoscenze acquisite sul versante acustico, utilizzando al
contempo una metodologia mutuata anche dalla dialettologia
percettiva (Cini & Regis 2002), la quale permette di osservare “come
la gente percepisce – non nel senso di ‘riceve, decodifica’ ma nel
senso di ‘intende/reagisce a’ – il linguaggio” (Berruto 2002: 343): la
ricerca vorrebbe essere pertanto un primo passo verso un più ampio
studio capace di sfruttare le conoscenze acquisite sul versante acustico
per meglio comprendere cosa succeda “dalla parte dell’ascoltatore”.
Proprio per questo suo carattere di indagine ‘pilota’, solo
1 Richiamiamo in nota alcuni dei lavori recenti compiuti nell’ambito della fonetica sperimentale. Diversi fenomeni consonantici sono affrontati in Marotta (2001), Marotta & Nocchi (2001), Marotta et aliae (2002), Nocchi (2002; 2003; 2004); alcuni sistemi vocalici sono descritti in Sorianello (2001; 2002), Calamai (2001; 2004a; 2004b). Aspetti prosodici sono trattati in Marotta & Sorianello (2001); Gili Fivela (2004); Marotta (2002); Brigato & Marotta (2002); Marotta & Sardelli (2003); Marotta, Calamai & Sardelli (2004). Per la durata vocalica e consonantica disponiamo delle indagini di Turchi & Bertinetto (2000), di Dell’Aglio, Bertinetto & Agonigi (2002), di Dell’Aglio (2003; 2004).
65
secondariamente ricorre all’analisi statistica, pur essendo abbastanza
consistente il campione di soggetti utilizzato nell’esperimento.
I dati sulla percezione di cambiamenti temporali e frequenziali sono
stati elicitati attraverso la tecnica cosiddetta matched-guise (§ 2),
utilizzata soprattutto negli studi di psicologia sociale e di
sociolinguistica2. Esperimenti sul campo che registrano le reazioni
percettive dei parlanti, così come le loro valutazioni soggettive,
possono essere interpretati pienamente soltanto se vengono confrontati
con l’uso effettivo: l’indagine è stata pertanto condotta in tre città –
Pisa, Livorno e Firenze – che sono già state descritte sul piano
acustico. Non sono molti gli studi che si propongono di combinare
fonetica acustica e dialettologia percettiva: la parte concernente i veri
e propri risultati (§ 5) è pertanto preceduta da alcune riflessioni
metodologiche, anche per mostrare il carattere controverso di certe
scelte relative alla costruzione del disegno sperimentale; alcune pagine
sono quindi dedicate alla presentazione del questionario (§ 3) e alla
costruzione delle batterie di stimoli (§ 4).
I fenomeni osservati riguardano il particolare vocalismo tonico di area
livornese e pisana, che si manifesta in un consistente abbassamento
2 In area italiana non sono molti i lavori che vi ricorrono, con diversi aggiustamenti (cfr. Baroni 1983; Volkart-Rey 1990; Antonini & Moretti 2000), e in ogni caso non nella prospettiva adottata in questa indagine. Risulta peraltro difficile trovare una univoca traduzione di matched-guise: in Berruto (1995: 113) si propone “travestimenti (di voci) a confronto”, in Volkart-Rey (1990: 30) “mascheramento (di voci) a confronto”, in Cardona (1988: 132) “falsa coppia”. Anche per questo abbiamo preferito mantenere l’etichetta inglese.
66
delle vocali medio-basse3 e nella velarizzazione di /a/, e che appare
un tratto ‘bandiera’, ben percepito dagli stessi parlanti (Calamai
2002). Gli aspetti acustici in gioco non si limitano all’abbassamento
della prima formante (peraltro concentrato su alcuni foni vocalici e
non esteso a tutto il sistema), ma coinvolgono anche il dominio
prosodico: nel parlato meno controllato si osserva una maggiore
durata per alcune vocali (in special modo quelle colpite da
abbassamento) e – soprattutto nelle parole prominenti – una maggiore
modulazione della frequenza fondamentale4. L’abbassamento delle
medio-basse è accompagnato (o, più probabilmente, preceduto) dalla
velarizzazione di /a/, che nell’area occidentale toscana occupa un’area
piuttosto posteriore dello spazio acustico (Calamai 2004a). Visto che
le differenze in gioco si situano sul piano della realizzazione (per le tre
città il sistema fonologico è, ovviamente, lo stesso) e visto che il
vocalismo fiorentino appare, da questo punto di vista, più neutro,
l’indagine vuole valutare se alcune variabili acustiche siano
sufficientemente salienti per segnalare l’appartenenza diatopica del
parlante.
3 La vocale // è spesso realizzata come [æ]: l’assetto acustico dell’area ha, nell’accezione di Ladefoged (1984), un carattere ‘asimmetrico’. 4 Marotta, Calamai & Sardelli (2004). Resta ancora da comprendere in maniera approfondita la presenza di una maggiore instabilità formantica e di (più o meno evidenti) dittongazioni in tipologie più libere di parlato; di dittongazioni – limitatamente a una pronuncia ‘marcata’ – scrive ad esempio Canepari (1999: 409-410).
67
2. La tecnica matched-guise
La tecnica utilizzata nell’esperimento è una particolare versione del
test denominato matched-guise, ideato negli anni Sessanta dal
canadese Wallace Lambert nel contesto bilingue francese-inglese: il
test intende stimolare situazioni e contesti in cui la riflessione
metalinguistica possa sorgere in maniera indiretta, evitando il ricorso a
domande esplicite. Nella sua forma canonica, i soggetti ascoltano
campioni di parlato da voci che vengono presentate dallo
sperimentatore come differenti e devono attribuire valutazioni
soggettive in relazione alla personalità di chi emette la voce ascoltata.
In realtà, le voci sono prodotte da uno stesso parlante che assume
differenti sembianze (guises), sfruttando diverse selezioni di variabili
linguistiche: in questo modo, quando un ascoltare risponde in maniera
divergente a due versioni della stessa voce, la differenza nel giudizio
può essere attribuita alla presenza/assenza di una particolare variabile.
È dunque possibile ottenere non reazioni inconsce alle voci (in realtà
emesse da un unico parlante) ma reazioni alle diverse lingue o alle
diverse varietà di lingua. Il vincolo dell’unico parlante pone tuttavia
delle limitazioni oggettive, legate alla evidente difficoltà di reperire
soggetti che siano perfettamente bilingui o che riescano comunque a
dominare allo stesso modo differenti varietà di lingua: anche per
questo motivo, la tecnica ha subito modifiche e aggiustamenti, come
68
ad esempio nel cosiddetto verbal guise5, in cui parlanti differenti
forniscono le differenti voci in diverse varietà di lingua.
Rispetto a metodologie più dirette, quali i questionari, una siffatta
tecnica permette un alto grado di introspezione e produce dunque
risposte più spontanee, anche se ha vari punti deboli, soprattutto nella
sua parte sperimentale: in primo luogo, viene usata in situazioni
(classi, laboratori) che non sono molto naturali e che in qualche modo
pongono costrizioni al soggetto, al quale peraltro viene chiesto un
compito piuttosto artificiale, poiché molto raramente può accadere che
le persone esprimano giudizi su altre persone soltanto sulla base della
voce. Inoltre, la ripetizione dello stesso messaggio all’interno delle
batterie di test porta il soggetto a concentrarsi sui tratti linguistici in
una maniera profondamente diversa rispetto a quanto avverrebbe in
una situazione comunicativa ‘normale’6. Infine, tale tecnica – che si
sposa bene con la tradizionale sociolinguistica correlativa e che è
preziosa per indagare variabili fonetiche – è stata criticata nei lavori di
impostazione interpretativa e pragmatica “per il suo basarsi su una
concezione statica del rapporto fra comportamento linguistico,
atteggiamenti e contesto situazionale” (Berruto 1995: 115).
Nella nostra ricerca viene usata non per indagare la percezione, da
parte dei parlanti, delle stratificazioni sociali così come queste
vengono veicolate dalla pronuncia, ma per valutare se certi indici
5 Una panoramica relativa a queste metodologie è in Ryan, Giles & Hewstone (1988). 6 Vd. quanto si scrive in § 4 a proposito della percezione dei cambiamenti di durata. Nel versione originale della tecnica, c’è anche il rischio che le voci siano giudicate sulla base dello stile di lettura e non sulla produzione linguistica vera e propria.
69
fonetici siano sufficienti a indicare la provenienza del parlante, alla
maniera con cui – mutatis mutandis – in Graff, Labov & Harris (1986)
è stata indagata la differenza tra black e white English nella parlata di
Philadelphia. Nella formulazione originale di Lambert, la tecnica non
mira a pesare la salienza relativa di specifici tratti linguistici; nella
versione modificata di Graff, Labov & Harris (1986) il focus ricade su
particolari tratti linguistici dotati di valenza sociolinguistica, tratti che
vengono sistematicamente variati mentre tutto il resto del materiale
fonico è mantenuto costante. Il disegno sperimentale costruito dagli
autori mira a valutare l’esistenza di una correlazione tra determinate
realizzazioni foniche e l’identità ‘etnica’: in particolare, viene
modificato un singolo suono7 nell’enunciato lasciando inalterata la
naturalezza della produzione linguistica col duplice scopo di valutare,
nel confronto tra black English e white English, sia il grado di
consapevolezza dei cambiamenti fonetici presso i parlanti, sia se
questi cambiamenti fonetici sono in grado di agire da ‘denominatori
etnici’ (markers of ethnic identity) all’interno della comunità
linguistica8.
7 Nella fattispecie, la diversa realizzazione dei dittonghi /aw/ e /ow/. 8 In tempi più recenti, anche nelle ricerche di Dennis Preston e di Nancy Niedzielski si fa ricorso alla sintesi vocale per indagare la relazione fra la percezione vocalica e i meccanismi del cambiamento linguistico presenti nell’area di Detroit (cfr. Niedzielski 1995, 1999; Preston 1997). In particolare, Niedzielski (1999) ricorre al cosiddetto vowel-matching, un compito sperimentale che mostra come la percezione vocalica non abbia un carattere assoluto e invariante ma al contrario sia mediata dalle conoscenze, reali o presunte tali, che del parlante ha l’ascoltatore (la provenienza, in primo luogo).
70
3. Costruzione del questionario
Il campione è costituito da una categoria relativamente omogenea di
soggetti, rappresentata da 55 studenti di V classi degli istituti tecnici di
Pisa, di Firenze e di Livorno9. La scelta si è concentrata su questa
popolazione poiché il versante per così dire ‘ingenuo’, legato alle
opinioni linguistiche, è stato oggetto di una precedente ricerca
condotta in quattro scuole superiori di Livorno e di Pisa (Calamai
2002). È quindi possibile mettere parzialmente a confronto le due
indagini per ottenere un quadro più preciso relativo alle dinamiche in
azione sul versante della linguistica ‘soggettiva’.
Differenti sezioni compongono il questionario, la cui struttura
apparentemente eterogenea è riportata nella Tab.1. Nella prima
domanda si chiedono informazioni generali riguardanti il soggetto
stesso10, il quale – nella seconda parte – viene invitato a descrivere il
proprio dialetto con accenni a possibili differenze generazionali. La
terza parte riguarda la creazione di mappe percettive: in una cartina
della Toscana il soggetto deve collegare insieme quelle zone giudicate
‘simili’ per quanto concerne la parlata. La quarta sezione riguarda i
confini vocalici e intende valutare la presenza di un effetto del luogo
di provenienza nella categorizzazione di coppie minime in cui
vengono modificate le formanti della vocale tonica (Calamai & Ricci,
in stampa). Le sezioni quinta e sesta del questionario prevedono
9 In ciascuna scuola, le sessioni sperimentali – della durata di circa un’ora – si sono svolte nel laboratorio linguistico e sono state precedute da una descrizione dettagliata del questionario; gli studenti, muniti di cuffia, hanno svolto il compito in banchi isolati fra loro. 10 Località di provenienza, età, sesso, luogo di nascita dei genitori.
71
l’utilizzo della tecnica matched-guise per quanto concerne la
percezione dei cambiamenti frequenziali e temporali in / a/
all’interno di parole isolate e, limitatamente alla percezione dei
cambiamenti temporali, in // e in // all’interno di frasi di parlato
semispontaneo. Infine, l’ultima parte si concentra più direttamente
sugli atteggiamenti linguistici e intende elicitare valutazioni soggettive
a frasi di parlato semispontaneo pronunciate da locutori provenienti da
Pisa, Firenze e Livorno11.
1 Informazioni sul soggetto (età, luogo di nascita, sesso)
2 Dialettologia ‘ingenua’ (informazioni sulla propria parlata e sulle differenze generazionali)
3 Mappe percettive
4 Confini tra vocali adiacenti (risposte chiuse)
5 Matched-guise – percezione della modifiche di durata e delle modifiche timbriche per //, // e /a/ in parole isolate (risposte chiuse)
6 Matched-guise – percezione della durata per // e // in frasi di parlato semispontaneo (risposte chiuse)
7 Indagine sugli elementi non linguistici (socio-culturali) associati a frasi di parlato semispontaneo prodotte da parlanti di Pisa, Firenze, Livorno (risposte aperte)
Tab.1 Schema del questionario
In un questionario costruito con l’apporto di diverse prospettive, le
attitudini verso alcune varietà di lingua, così come le relazioni tra
particolari fenomeni fonetici e la loro provenienza geografica possono
11 La parte relativa alle mappe percettive e quella relativa all’ultima sezione del questionario è oggetto di un contributo a parte, in fase di avanzata elaborazione.
72
essere utilmente rapportate con la percezione soggettiva dei confini tra
le diverse parlate toscane12.
4. Costruzione delle batterie sperimentali: scelte metodologiche e
procedure operative
Gli aspetti metodologici implicati nella costruzione del test matched-
guise mediante l’ausilio della sintesi vocale sono molti e abbastanza
complessi. In primo luogo, lo sperimentatore deve decidere che tipo di
materiale manipolare, sia da un punto di vista della modalità di parlato
(se naturale o sintetico)13, sia da un punto di vista della
caratterizzazione diatopica (italiano neutro o italiano regionale di base
toscana?)14, sia infine da un punto di vista della caratterizzazione
diafasica (parlato letto, altamente controllato, o parlato più ‘libero’,
ipoarticolato?). Se la scelta si colloca verso il polo alto tra i due
estremi supra descritti (se, ad esempio, si decide di utilizzare una lista
di parole lette da uno speaker professionista privo di inflessione
dialettale o regionale), lo sperimentatore deve poi decidere se usare
parole o pseudoparole: nel caso delle parole, il risultato potrebbe
venire ‘sporcato’ da un effetto frequenza15; nel caso delle
pseudoparole, il compito potrebbe diventare innaturale e
particolarmente difficile senza uno specifico addestramento. Anche
12 Cfr. Preston (1989: 3); Williams, Garrett, Coupuland (1999: 345-346); Clopper & Pisoni (2005: 319). 13 L’intelligibilità e la comprensione di parlato sintetico sono diverse rispetto alla comprensione e alla intelligibilità di parlato naturale (Liu & Kewley-Port 2004). 14 Con tutti i dubbi che simili etichette si portano dietro. 15 L’informazione lessicale può influenzare l’identificazione della parola (Ganong 1980).
73
per questi motivi, l’indagine non si è concentrata su di un solo stile
d’eloquio: l’esperimento prevede sia una sessione con materiale
proveniente da parlato letto (§ 5.1), sia una sessione – più piccola –
costruita con materiale proveniente da parlato semispontaneo (§ 5.2).
Obiettivo della ricerca è valutare se una differenza relativa ai valori
frequenziali o temporali nella vocale tonica è sufficiente per segnalare
una distinzione fra le tre città toscane; se, in altre parole, è sufficiente
per agire come segnale ‘geografico’. Dal momento che l’indagine non
si concentra su aspetti squisitamente linguistici, ma punta l’attenzione
sul legame tra fatti di lingua e (eventuale) marcatezza diatopica, le
modifiche ai valori formantici e a quelli di durata sono state compiute
per passi piuttosto macroscopici16: 50-100 Hz per le formanti, 22-32
ms per gli incrementi temporali del 20%17, 57-80 ms (nel parlato letto)
e 71-111 ms (nel parlato semispontaneo) per gli incrementi temporali
del 50%. Le modifiche formantiche avvengono dunque mediante
intervalli superiori ai valori soglia percepibili dall’orecchio umano,
nonostante in letteratura questi valori non siano univoci (cfr. Flanagan
1955, 1957; Mermelstein 1978; Kewley-Port & Watson 1994)18.
Anche nel caso dei cambiamenti in durata, non c’è accordo completo
16 Un percorso differente è stato adottato nelle batterie di coppie minime, ove l’attenzione è concentrata sul confine categoriale tra vocali contigue nello spazio acustico (Calamai & Ricci, in stampa). 17 La motivazione alla base di tale valore percentuale è discussa infra. 18 Gli incrementi percentuali di F1 sono del 19,4%, del 29,1% e del 38,8% per lo stimolo esplodere e del 22,2%, del 33,4%, del 44,5% per lo stimolo perfetto. Nel caso di calco, la F1 è stata diminuita del 6,1% e del 12,3%, mentre la F2 è stata diminuita del 7,8% e del 15,7%. Ricordiamo che in Kewley-Port & Watson (1994) la soglia per la discriminazione uditiva delle frequenze formantiche è stabilita, per F1, in circa 14 Hz e, per F2, in circa l’1.5% del valore della stessa formante.
74
su quale sia il valore delle minime differenze temporali che l’orecchio
può percepire: le cosiddette Just Noticeable Differences (JND) sono
comprese tra i 10 e i 40 ms (Lehiste 1970: 11-13; Klatt 1976: 1218-
19)19. L’intervallo temporale relativamente esteso che emerge dai vari
risultati presenti in letteratura potrebbe essere spiegato, in parte, dallo
stesso disegno sperimentale: il fatto che in molte indagini la medesima
parola target sia ripetuta più volte permette all’ascoltatore di
sviluppare strategie in grado di affilare la propria capacità di udire
differenze temporali anche piccole (Klatt 1976: 1219; O’Shaughnessy
1987: 160-161). L’aumento del 50% della durata vocalica è dunque un
aumento senza dubbio percepibile; in ogni caso, nella costruzione
delle batterie sperimentali, è stato inserito anche un allungamento per
così dire ‘intermedio’, del 20%: soltanto le modifiche temporali che
raggiungono questa soglia possono servire come indici percettivi
primari (Klatt 1976: 1219).
Sempre in relazione al protocollo di analisi sono da menzionare,
seppur in maniera cursoria, altri caveat relativi a fattori quali
l’addestramento dei soggetti, l’esistenza di strategie individuali nei
compiti uditivi, le condizioni ambientali in cui è stato svolto il test. In 19 La sensibilità ai cambi di durata dipende essenzialmente da tre fattori (Klatt & Cooper 1975): la durata intrinseca del segmento (le JND sono direttamente proporzionali alla durata complessiva del segmento), la posizione della sillaba nella parola (la sensibilità ai cambi di durata è maggiore per i segmenti in sillabe non finali di parola), la posizione della parola nell’enunciato. I soggetti sono più sensibili a mutamenti nella durata delle vocali rispetto a mutamenti nella durata delle consonanti (Huggins 1972: 1274); alterazioni nella durata della vocale influenzano l’accettabilità di un item più delle alterazioni nella durata della consonante (Carlson & Granström 1975). Infine, sulla percezione della durata di un fono vocalico
75
primo luogo, anche se la parte sulla percezione dei cambiamenti di
durata e di frequenze formantiche è stata spiegata in dettaglio,
l’esperimento non ha previsto un esplicito addestramento dei soggetti:
considerati i luoghi di svolgimento del test e la tipologia delle persone
coinvolte, si è ritenuto opportuno non far precedere l’esperimento da
sessioni di prova e di familiarizzazione con le singole batterie. Il
mancato addestramento è tuttavia un elemento da considerare nella
valutazione dei risultati: almeno nella discriminazione delle frequenze
formantiche (Kewley-Port 2001), indagini sperimentali hanno
evidenziato la non piccola rilevanza di questo fattore20. Inoltre,
sarebbe necessario prendere in debita considerazione l’esistenza di
strategie squisitamente individuali e altamente variabili nei compiti di
carattere uditivo (Johnson et al. 1987; Makashay 2003), nonostante
molte indagini di psicolinguistica tendano a considerare la categoria
degli ascoltatori cosiddetti ‘normali’ come una categoria omogenea. In
più, il materiale utilizzato e l’architettura sperimentale adottata sono in
grado di influenzare sia le risposte, sia il processo di categorizzazione
dell’ascoltatore (Cutugno & Savy 1996): un paradigma a risposte
forzate pone vincoli e limiti che spingerebbero a ripetere il test in una
diversa condizione sperimentale, con una differente strutturazione del
questionario, provando a costruire paradigmi di risposte libere o
parzialmente libere. Infine, sono ancora pochissime le indagini che
hanno per oggetto le differenze che intercorrono tra la percezione di l’andamento della frequenza fondamentale ha una importanza non secondaria (Pisoni 1976).
76
suoni in condizioni ottimali di ascolto e la percezione di suoni in
condizioni ‘normali’ di ascolto21: il laboratorio linguistico di una
scuola superiore non è una camera silente, né una piazza animata in un
giorno di mercato, e anche da questo punto di vista, dunque, la nostra
indagine si colloca in un territorio di confine, di cui si dovrà tenere
conto in fase di ampliamento della ricerca.
Gli ‘oggetti’ manipolati nell’esperimento sono alcune vocali toniche,
nei loro attributi frequenziali (prima e seconda formante) e nei loro
attributi temporali (durata): l’indagine si è concentrata sulle vocali
bandiera // e // e (limitatamente alle parole isolate) sulla vocale /a/22.
Negli stimoli di parlato letto, i fenomeni sotto osservazione sono sia i
cambiamenti timbrici, sia i cambiamenti nella durata; in quelli di
parlato semispontaneo, l’indagine si è concentrata esclusivamente
sulla percezione di cambiamenti temporali. Le batterie di stimoli sono
state realizzate con il programma Analysis-Synthesis Laboratory
(ASL) della Kay Elemetrics23 e sono state sottoposte ai soggetti tramite
il programma Meds 2002 (Music Experiment Development System), in
ordine casuale e intervallate da un suono sintetico (beep). A titolo
esemplificativo, in Tabb. 2-4 sono riportati alcuni stimoli, sia per le
modifiche in altezza vocalica, sia per le modifiche in durata,
20 Sull’addestramento dei soggetti si soffermano anche Clopper & Pisoni (2005: 328-329). 21 Un primo esperimento in tal senso è l’indagine di Kewley-Port & Zheng (1999), incentrata sulla percezione delle frequenze formantiche. 22 Sono in corso di somministrazione sessioni sperimentali che prendono in considerazione anche le altre vocali. 23 I dettagli delle modifiche sono descritti in §§ 5.1 e 5.2.
77
relativamente a una entrata di parlato letto e a una frase di parlato
semispontaneo.
F1 File Audio
1° originale originale.mp3
2° +100 Hz +100 Hz.mp3
3° +150 Hz +150 Hz.mp3
4° +200 Hz +200 Hz.mp3
Tab.2 Modifiche frequenziali sulla parola esplodere.
durata File Audio
1° originale originale.mp3
2° +20% +20%.mp3
3° +50% +50%.mp3
4° -50% -50%.mp3
Tab.3 Modifiche temporali sulla parola esplodere.
78
durata File Audio
1° originale originale.mp3
2° +50% +50%.mp3
3° -50% -50%.mp3
Tab.4 Modifiche temporali sulla frase Sì, verso la destra sì.
Nei due riquadri viene riportato un estratto dal questionario,
esattamente nella forma in cui è stato sottoposto agli studenti.
4) Ora sentirai alcune parole (esplodere, perfetto, calco) ripetute più volte (sono pronunciate da persone differenti). Prova a dire da quale città provengono le persone che pronunciano queste parole facendo la crocetta sulla località che ti sembra più pertinente I. esplodere: esplodere1 Pisa Livorno Firenze esplodere2 Pisa Livorno Firenze esplodere3 Pisa Livorno Firenze esplodere4 Pisa Livorno Firenze esplodere5 Pisa Livorno Firenze esplodere6 Pisa Livorno Firenze esplodere7 Pisa Livorno Firenze
Ora ascolterai alcune frasi di persone che provengono da varie parti della Toscana: devi decidere qual è la loro città di provenienza 1) La frase che sentirai per tre volte, pronunciata da persone diverse, è:
Sì, verso la destra, sì. (Le persone rispondono alla domanda: Devo andare verso la destra?). Le registrazioni sono state fatte per strada, c’è un po’ di rumore.....
1) Pisa Livorno Firenze 2) Pisa Livorno Firenze 3) Pisa Livorno Firenze
79
Come mostrano i due esempi, i soggetti hanno creduto di ascoltare
stimoli provenienti da parlanti differenti: a queste ‘diverse’ voci
dovevano attribuire la provenienza, scegliendo fra le tre città di Pisa,
Firenze e Livorno24.
5. Risultati
All’interno della cosiddetta Informal Literature, nelle descrizioni più
o meno impressionistiche delle varietà di Firenze, di Pisa e di Livorno,
non sono rari i riferimenti relativi alla maggiore o minore durata dei
segmenti25. Ad esempio, della “molta velocità del parlato fiorentino”
scrive il grammatico Girolamo Rosasco in un passo del VII dialogo
Della lingua toscana (1777: 750):
Passiamo ora ad esaminare i difetti da voi notati. Dite che i Fiorentini parlano con molta velocità. [...] Né so per qual ragione si abbia a fare in un tempo più lungo un’azione, che si può fare in più breve; conciossiaché quel tempo di più, che utilmente si spende, pare che ozio si possa chiamare, e in conseguenza difetto. E in che cosa s’ha egli ad impiegare quel tempo di più in parlando, se non in qualche cadenza, cantilena, o strascico di parole?
Sulla cantilena e sulla lentezza del pisano si soffermano Zuccagni
Orlandini (1864: 274), Sanminiatelli (1972: 50-51), Panzini (1919:
313); sulla lentezza e sulla cantilena del livornese scrivono, tra gli
altri, Micheli (1897: 6-7) e Marchi (1993: 62). Anche in Calamai
(2002) la “lentezza” risulta essere uno degli attributi più ricorrenti
24 I soggetti hanno udito ogni stimolo una sola volta. Siamo coscienti che questa procedura sperimentale non è esente da critiche, come si rileva in Clopper & Pisoni (2005: 321): se il test non fosse avvenuto all’interno di scuole superiori, con una tempistica relativamente rigida, sarebbe stato preferibile consentire ai soggetti di ascoltare ripetutamente i singoli stimoli. 25 Una rassegna è in Calamai (2004a).
80
nella descrizione della varietà livornese: “Le parole si pronunciano
lentamente enfatizzando su alcune di queste e [la cadenza] è aperta e
chiassosa”; “La cadenza è più lenta e si sofferma più sulle vocali”;
“La cadenza è blanda, ci soffermiamo molto sulle vocali”26.
Ugualmente, le vocali medie – e in particolare // – sono giudicate più
aperte, a Pisa più che a Firenze, e a Livorno più che a Pisa.
Nei §§ 5.1 e 5.2 vedremo allora se queste valutazioni per così dire
‘ingenue’ sono confermate anche da una analisi condotta con la
tecnica matched-guise. Per entrambi gli stili di parlato, sono
commentati sia i risultati suddivisi per scuola, sia i risultati
complessivi, in modo da evidenziare possibili tendenze generali.
Negli istogrammi sono riportati i valori percentuali del campione; le
frequenze complessive sono state sottoposte anche a una verifica
statistica mediante il test del χ2, in grado di fornire una misura
dell’adattamento tra la distribuzione teorica e la distribuzione
empirica27.
26 Sarebbero da indagare dettagliatamente quali siano i tratti legati alla personalità del parlante associati alla maggiore o minore lentezza d’eloquio; esperimenti condotti con parlato sintetico hanno mostrato come l’attribuzione di tratti psicologici quali ‘competenza’ e ‘benevolenza’ siano direttamente collegati alla manipolazione delle velocità: una maggiore competenza del parlante (e una sua minore benevolenza) è associata all’aumento della velocità d’eloquio (Brown, Strong & Rencher 1974; Smith et alii 1975). Sull’area oggetto d’indagine, l’ultima sezione del questionario fornirà alcuni dati in proposito. 27 Il test si basa sul confronto tra frequenze osservate (sul campione) e frequenze attese sulla base dell’ipotesi nulla che prevede un’equidistribuzione delle risposte. La conferma statistica dell’ipotesi alternativa (ovvero: frequenze diverse nelle tre città) non consente tuttavia di specificare ulteriormente l’ipotesi: in altre parole, non è possibile stabilire quale delle tre città abbia influito maggiormente all’interno dell’analisi, pur essendo il peso di ciascuna individuabile, almeno in parte, sulla base delle mere frequenze. La soglia di significatività è stata fissata al 5%.
81
5.1 Parlato letto
Sono state modificate tre parole prodotte in isolamento da un locutore
fiorentino proveniente dal corpus AVIP-API: esplodere, perfetto,
calco28. La vocale tonica dei tre stimoli – giudicati piuttosto neutri per
quanto concerne la resa dialettale – è stata dimezzata del 50% ed è
stata allungata del 20% e del 50%. Per le vocali toniche medio-basse,
il tracciato della prima formante è stato aumentato di 100 Hz, di 150
Hz, di 200 Hz. Per quanto concerne la vocale bassa, sono state
modificate sia la prima che la seconda formante29: nel primo caso, il
tracciato di F1 è stato diminuito di 50 Hz, mentre il tracciato di F2 è
stato diminuito di 100 Hz; nel secondo stimolo modificato, il tracciato
di F1 è stato diminuito di 100 Hz, e il tracciato di F2 è stato diminuito
di 200 Hz. Per ciascuna parola la batteria è stata presentata secondo
sequenze casuali.
In § 5.1.1 sono presentati i risultati in percentuale relativi alle risposte
degli studenti per quanto riguarda i tracciati formantici; in § 5.1.2 i
risultati relativi alle modifiche in durata per le tre vocali.
28 Riportiamo di seguito i valori originali, di frequenza e di durata. Esplodere: F1 515 Hz, F2 935 Hz, F3 2902 Hz, F4 3649 Hz, f0 140 Hz, durata 161 ms; perfetto: F1 449 Hz, F2 1924 Hz, F3 2459 Hz, F4 3465 Hz, f0 142 Hz, durata 114 ms; calco: F1 809 Hz, F2 1268 Hz, F3 2380 Hz, F4 3371 Hz, f0 146 Hz, durata 134 ms. In questa prima fase della ricerca, le variabili ‘lunghezza della parola’, ‘struttura sillabica’, ‘struttura accentuale’ non sono state controllate. 29 In area occidentale la vocale bassa è realizzata come vocale posteriore: è stato dunque necessario intervenire su entrambe le formanti.
82
5.1.1 Modifiche in frequenza
Vocale //
Le Figg.1-3 riportano i valori percentuali suddivisi per località; la
Fig.4 i risultati globali. A Firenze e a Pisa lo stimolo originale è
avvertito come facente parte della propria varietà (fiorentino a
Firenze, pisano a Pisa); a Livorno l’originale è etichettato come
fiorentino. Nelle tre località il cambiamento nell’attribuzione della
provenienza avviene quando lo stimolo aumenta di 200 Hz.
0
20
40
60
80
100
originale F1 +100 F1 +150 F1 +200
Livorno
Pisa
Firenze
0
20
40
60
80
100
originale F1 +100 F1 +150 F1 +200
LivornoPisaFirenze
Fig.1 Scuola di Firenze Fig.2 Scuola di Pisa
0
20
40
60
80
100
originale F1 +100 F1 +150 F1 +200
Livorno
Pisa
Firenze
0
20
40
60
80
100
originale F1 +100 F1 +150 F1 +200
Livorno
Pisa
Firenze
Fig.3 Scuola di Livorno Fig.4 Valori complessivi
83
La Fig.4 mostra come l’aumento dei valori della prima formante porti
a percepire lo stimolo come ‘non fiorentino’30.
Vocale //
Le Figg.5-7 riportano i valori percentuali suddivisi per località; la
Fig.8 i risultati globali: il quadro che emerge dai risultati relativi alla
vocale ‘bandiera’ per eccellenza è parzialmente differente rispetto a
quanto è stato osservato per la vocale posteriore. Nei dati fiorentini ci
sono due ‘salti’ di località: il primo poco facilmente spiegabile, dal
momento che l’originale è classificato come pisano e che l’aumento di
100 e di 150 Hz porta a classificare i due stimoli come fiorentini; il
secondo atteso, poiché individua nello stimolo con // aumentata di
200 Hz una provenienza livornese. Nelle scuole di Pisa e di Livorno il
‘salto’ di località avviene subito a 100 Hz: i due stimoli superiori a
questa soglia sono etichettati a Pisa come pisani e a Livorno come
livornesi.
30 La distribuzione è statisticamente significativa per lo stimolo con l’aumento di 100 Hz (χ2 critico 6,266; p. 0,004) e per lo stimolo con l’aumento di 200 Hz (χ2
critico 14,681; p. 0,001).
84
0
20
40
60
80
100
originale F1 +100 F1 +150 F1 +200
LivornoPisaFirenze
0
20
40
60
80
100
originale F1 +100 F1 +150 F1 +200
LivornoPisaFirenze
Fig.5 Scuola di Firenze Fig.6 Scuola di Pisa
0
20
40
60
80
100
originale F1 +100 F1 +150 F1 +200
LivornoPisaFirenze
0
20
40
60
80
100
originale F1 +100 F1 +150 F1 +200
Livorno
Pisa
Firenze
Fig.7 Scuola di Livorno Fig.8 Valori complessivi
Come per //, l’aumento della prima formante fa sì che lo stimolo sia
percepito come livornese31. La differenza rispetto alla vocale
posteriore sta nel giudizio attributo allo stimolo originale, ritenuto
pisano nelle scuole di Firenze e di Livorno. Per la vocale // le
percentuali complessive mostrano che basta un aumento di 100 Hz per
etichettare lo stimolo come livornese (per la vocale //, invece, questa
categorizzazione avviene, nel campione complessivo, a 150 Hz).
31 La distribuzione è statisticamente significativa per lo stimolo originale (χ2 critico 15,009; p. 0,001) e per lo stimolo con l’aumento di 150 Hz (χ2 critico 8,649; p. 0,013).
85
Vocale /a/
I valori percentuali suddivisi per località sono riportati nelle Figg. 9-
11; nella Fig.12 compaiono i risultati globali. Anche se i risultati
appaiono meno univoci, sono ugualmente rintracciabili linee di
tendenza32. Nel campione fiorentino lo stimolo è progressivamente
percepito come ‘meno fiorentino’ con l’aumento delle modifiche nei
tracciati formantici; nel campione pisano non si registra alcun effetto
relativo alla località di attribuzione; negli studenti livornesi lo stimolo
più posteriore è giudicato pisano, mentre gli altri due stimoli sono
reputati di provenienza livornese.
32 Il test del χ2 riporta esiti significativi solo per la distribuzione delle frequenze nel caso dello stimolo originale (χ2 critico 7,111; p. 0,029).
86
0
20
40
60
80
100
originale F1-50, F2-100 F1-100, F2-200
LivornoPisaFirenze
0
20
40
60
80
100
originale F1-50, F2-100 F1-100, F2-200
LivornoPisaFirenze
Fig.9 Scuola di Firenze Fig.10 Scuola di Pisa
0
20
40
60
80
100
originale F1 -50, F2 -100 F1 -100, F2 -200
LivornoPisaFirenze
0
20
40
60
80
100
originale F1 -50 F2 -100 F1 -100 F2 -200
Livorno
Pisa
Firenze
Fig.11 Scuola di Livorno Fig.12 Valori complessivi
Nel complesso, lo stimolo più posteriore è giudicato di provenienza
occidentale (pisana in primis, in secondo luogo livornese). Questa
risposta mostra una buona coincidenza tra produzione e percezione: la
velarizzazione di /a/ è un tratto che ritroviamo diffusamente nella
Toscana occidentale e non è fenomeno tipicamente livornese.
5.1.2 Modifiche in durata
A differenza di quanto è stato osservato per i tracciati formantici,
l’effetto del luogo di attribuzione risulta meno chiaro; nel complesso,
l’aumento di durata del 20% appare scarsamente percepibile.
87
Vocale //
Le Figg.13-15 riportano i valori percentuali suddivisi per località; la
Fig.16 i risultati globali. Nel campione fiorentino, l’aumento del 50%
porta a etichettare lo stimolo come pisano (ma lo scarto è comunque
minimo); nel campione pisano, l’aumento del 50% spinge a etichettare
lo stimolo come livornese; a Livorno la distribuzione delle percentuali
non mostra alcun effetto della località di attribuzione33.
0
20
40
60
80
100
originale V -50% V +20% V +50%
LivornoPisaFirenze
0
20
40
60
80
100
originale V -50% V +20% V +50%
LivornoPisaFirenze
Fig.13 Scuola di Firenze Fig.14 Scuola di Pisa
0
20
40
60
80
100
originale V -50% V +20% V +50%
LivornoPisaFirenze
0
20
40
60
80
100
originale V -50% V +20% V +50%
Livorno
Pisa
Firenze
Fig.15 Scuola di Livorno Fig.16 Percentuali complessive
33 È francamente inspiegabile il risultato relativo alla vocale abbreviata del 50%, percepita da molti soggetti come livornese. Forse la vocale modificata – che nella
88
La Fig.16 mostra come nella vocale tonica di esplodere l’aumento o la
diminuzione della durata non risulti essere legata a una località in
particolare34.
Vocale //
I valori percentuali suddivisi per località sono riportati nelle
Figg.17-19; i risultati globali nella Fig.20. Nel campione fiorentino e
in quello livornese non si evidenzia alcun effetto della località di
attribuzione; nel campione pisano si registra un ‘salto’ nello stimolo
allungato del 50%, etichettato come livornese da molti studenti.
sua versione ‘ridotta’ misura 80 ms – non è abbastanza breve per poter essere percepita come ‘non livornese’. 34 La distribuzione è statisticamente significativa soltanto per lo stimolo con la vocale tonica allungata del 20% (χ2 critico 7,905; p. 0,019).
89
0
20
40
60
80
100
originale V -50% V +20% V +50%
LivornoPisaFirenze
0
20
40
60
80
100
originale V -50% V +20% V +50%
LivornoPisaFirenze
Fig.17 Scuola di Firenze Fig.18 Scuola di Pisa
0
20
40
60
80
100
originale V -50% V +20% V +50%
LivornoPisaFirenze
0
20
40
60
80
100
originale V -50% V +20% V +50%
Livorno
Pisa
Firenze
Fig.19 Scuola di Livorno Fig.20 Percentuali complessive
Come per //, i cambiamenti nella durata hanno una scarsa rilevanza
nell’attribuzione alla località di provenienza della voce35.
Vocale /a/
Le Figg.21-23 riportano i valori percentuali suddivisi per località; la
Fig.24 i risultati globali. L’effetto del fattore ‘luogo di attribuzione’ è
evidente nel campione pisano e in quello fiorentino, ove il ‘salto’ di
località avviene nello stimolo allungato del 50%, mentre non compare
nel campione livornese.
35 La distribuzione è statisticamente significativa per lo stimolo originale (χ2 critico 15,009; p. 0,001) e per lo stimolo con la vocale tonica allungata del 20% (χ2 critico 7,578; p. 0,023).
90
0
20
40
60
80
100
originale V -50% V +20% V +50%
LivornoPisaFirenze
0
20
40
60
80
100
originale V -50% V +20% V +50%
LivornoPisaFirenze
Fig.21 Scuola di Firenze Fig.22 Scuola di Pisa
0
20
40
60
80
100
originale V -50% V +20% V +50%
LivornoPisaFirenze
0
20
40
60
80
100
originale V -50% V +20% V +50%
Livorno
Pisa
Firenze
Fig.23 Scuola di Livorno Fig.24 Percentuali complessive
Nel complesso, la vocale allungata del 50% risulta essere indice di
livornesità; specularmente, la vocale abbreviata del 50% ha la
percentuale più bassa di attribuzioni livornesi36.
Le distribuzioni percentuali relative ai cambiamenti formantici
risultano abbastanza chiare anche in una tipologia di parlato molto
controllata, come quella rappresentata dagli stimoli di parlato letto;
all’interno dello stesso materiale sonoro, i cambiamenti di durata
36 La distribuzione è statisticamente significativa per lo stimolo originale (χ2 critico 15,009; p. 0,030), per lo stimolo con la vocale tonica dimezzata del 50% (χ2 critico 15,774; p. 0,000) e per lo stimolo con la vocale tonica allungata del 50% (χ2 critico 17,829; p. 0,000).
91
sembrano essere al contrario meno strettamente legati alla variabile
diatopica. Anche per questa ragione è stata costruita una batteria di
stimoli di parlato semispontaneo (vd. § 5.2) che possa rappresentare
un utile raffronto.
Nel valutare i risultati provenienti dal parlato letto, non sarà forse da
ignorare una certa ‘resistenza’ del materiale sonoro di partenza,
rappresentato da un fiorentino piuttosto neutro, su cui sono stati
aggiunti fenomeni ‘non fiorentini’ (cfr. § 4): tra questi, in ogni caso,
sono le modifiche timbriche a essere più caratterizzate in senso
geografico.
5.2 Parlato semispontaneo: modifiche in durata
Per un confronto con quanto è emerso dagli stimoli di parlato letto,
sono state utilizzate tre frasi provenienti da parlato semispontaneo
(map tasks), prodotte da un locutore pisano37. Di ciascuna vengono
riportati, entro parentesi, i valori medi di F1, F2, la durata e
l’escursione in semitoni della vocale tonica poi modificata nei suoi
valori temporali:
a) Sì, verso la destra, sì… (F1 553, F2 1630, ms 173, ST 3,52)
b) Sì, la faccio a destra… (F1 587, F2 1645, ms 142, ST 1,4)
c) Tipo, non lo so, se ho fame, una pasticceria… (F1 583, F2
1112, ms 223, ST 2,95)
37 Il materiale sonoro proviene dal corpus AVIP: in particolare, si tratta dell’instruction follower della mappa A03 di Pisa.
92
Sono state prese in considerazione due frasi con la vocale // tonica
prominente che fossero formalmente confrontabili38, e che
presentassero una differenza consistente per quanto concerne i valori
di durata e di modulazione della frequenza fondamentale all’interno
del segmento vocalico poi sottoposto a modifica. In più, anche il
fattore ‘abbassamento vocalico’ è differente nelle due vocali toniche
sotto osservazione: il segmento più lungo e più modulata è meno
aperto, mentre il segmento più aperto è più breve e meno modulato39.
La vocale tonica delle parole destra e so è stata allungata e dimezzata
del 50%40. Ai soggetti è stato chiesto, al solito, di attribuire, per
ciascuna frase somministrata in sequenze casuali, la località di
provenienza, scegliendo tra Pisa, Firenze, Livorno.
Frase (a) Sì, verso la destra, sì…
Le Figg.25-27 riportano i valori percentuali suddivisi per località; la
Fig.28 i risultati globali. L’originale è giudicato livornese a Firenze,
pisano a Pisa e a Livorno. A Firenze e a Livorno lo stimolo con la
vocale tonica abbreviata è giudicato fiorentino, a Pisa è reputato
pisano.
38 In entrambi i casi viene modificata la vocale tonica di una stessa parola, finale di sintagma intonativo. I due enunciati sono comparabili anche per quanto riguarda la durata complessiva (1483 ms vs. 1033 ms.). 39 Per la prima formante, la differenza è di 34 Hz, valore superiore alla soglia indicata in Kewley-Port & Watson (1994) per la discriminazione di F1. La seconda formante, al contrario, ha in entrambi i casi un valore molto simile. 40 La vocale non è stata allungata del 20% poiché questo aumento percentuale ha prodotto risultati poco rilevanti nel caso di parlato letto (vd. § 5.1).
93
0
20
40
60
80
100
originale V +50% V -50%
LivornoPisaFirenze
0
20
40
60
80
100
originale V +50% V -50%
LivornoPisaFirenze
Fig.25 Scuola di Firenze Fig.26 Scuola di Pisa
0
20
40
60
80
100
originale V +50% V -50%
LivornoPisaFirenze
0
20
40
60
80
100
orig ina le V +50% V -50%
Livorno
Pisa
Firenze
Fig.27 Scuola di Livorno Fig.28 Percentuali complessive
La frase originale è nel complesso reputata di provenienza non
fiorentina, la frase con la vocale tonica allungata è inequivocabilmente
reputata livornese, la frase con la vocale più breve è giudicata la meno
livornese di tutte (con una minima maggioranza di risposte
fiorentine)41.
Frase (b) Sì, la faccio a destra…
Le Fig.29-31 riportano i valori percentuali suddivisi per località; la
Fig.32 i risultati globali. Lo stimolo originale è giudicato pisano a
94
Firenze e a Pisa mentre nel campione livornese è giudicato soprattutto
fiorentino42.
0
20
40
60
80
100
originale V +50% V -50%
LivornoPisaFirenze
0
20
40
60
80
100
originale V +50% V -50%
LivornoPisaFirenze
Fig.29 Scuola di Firenze Fig.30 Scuola di Pisa
0
20
40
60
80
100
originale V +50% V -50%
LivornoPisaFirenze
0
20
40
60
80
100
originale V +50% V -50%
Livorno
Pisa
Firenze
Fig.31 Scuola di Livorno Fig.32 Percentuali complessive
Il grafico in Fig.32 mostra un andamento simile a quello riportato in
Fig.28: in entrambi i casi, la maggiore lunghezza vocalica è indice di
livornesità. Rispetto a quanto viene rilevato per la frase (a), lo stimolo
originale risulta meno connotabile in senso geografico mentre lo
41 La distribuzione è statisticamente significativa per la frase con la vocale tonica allungata del 50% (χ2 critico 26,703; p. 0,000). 42 Per gli studenti di Livorno, evidentemente, manca ‘qualcosa’ che possa connotare la voce come inequivocabilmente livornese.
95
stimolo con la vocale tonica più breve ottiene un maggior numero di
risposte che lo individuano come fiorentino43.
Frase (c) Tipo, non lo so, se ho fame, una pasticceria…
Le Figg.33-35 riportano i valori percentuali suddivisi per località; la
Fig.36 i risultati globali. La frase originale è reputata livornese a
Firenze, pisana a Pisa, fiorentina a Livorno. Nelle risposte del
campione fiorentino non risulta evidente alcun effetto del luogo (la
maggioranza dei soggetti giudica fiorentina sia la vocale allungata, sia
la vocale abbreviata). L’allungamento vocalico è giudicato
inequivocabilmente livornese soltanto nel campione pisano.
43 La distribuzione è statisticamente significativa per la frase originale (χ2 critico 7,337; p. 0,026), per la frase con la vocale tonica allungata del 50% (χ2 critico 42,222; p. 0,000), per la frase con la vocale tonica dimezzata del 50% (χ2 critico 15,884; p. 0,000).
96
0
20
40
60
80
100
originale V +50% V -50%
LivornoPisaFirenze
0
20
40
60
80
100
originale V +50% V -50%
LivornoPisaFirenze
Fig.33 Scuola di Firenze Fig.34 Scuola di Pisa
0
20
40
60
80
100
originale V +50% V -50%
LivornoPisaFirenze
0
20
40
60
80
100
originale V +50% V -50%
Livorno
Pisa
Firenze
Fig.35 Scuola di Livorno Fig.36 Percentuali complessive
I dati riportati in Fig.36 mostrano sì il carattere livornese
dell’allungamento vocalico, ma nel contempo evidenziano anche una
minore ‘riconoscibilità’ di //44.
6. Osservazioni conclusive
Sono stati manipolati sperimentalmente due tratti acustici – durata e
frequenze formantiche – all’interno di alcune vocali toniche:
l’attenzione si è concentrata sulle due vocali ‘bandiera’ per le varietà
44 La distribuzione è statisticamente significativa per la frase con la vocale tonica allungata del 50% (χ2 critico 6,266; p. 0,044).
97
di Pisa e di Livorno – // e // – e sulla vocale /a/. Sono state prese in
esame sia le distribuzione percentuale relativa a ciascuna delle tre
località, sia la distribuzione percentuale relativa alle risposte
complessive, queste ultime sottoposte anche a una analisi statistica:
sono state individuate alcune linee di tendenza comuni, all’interno di
un quadro in parte anche contraddittorio, che in qualche modo
potrebbe segnalare, da parte dell’ascoltatore, la difficoltà e il disagio
nei confronti di ciò che è avvertito “come puro stimolo fonico, o
semplice sequenza di suoni, non ancora immagine, tanto meno
segnale, privo come è di funzione comunicativa” (Romanello 2002:
294). Non è un caso che studiosi attivi nel campo della dialettologia
percettiva abbiano più volte sottolineato come nella tecnica matched-
guise sia implicita una ipersemplificazione di quell’attività che va
sotto il nome di ‘riconoscimento dialettale’ (Preston 1989: 3;
Williams, Garrett, Coupland 1999: 346-348).
Per i movimenti formantici all’interno delle vocali bandiera,
l’aumento di F1 è fattore sufficiente – anche in stimoli di parlato letto
– a etichettare lo stimolo come livornese, con una differenza legata al
timbro: per // la percezione della provenienza livornese avviene con
una modifica più piccola del valore frequenziale di partenza45. Per i
cambiamenti di durata, l’effetto del fattore ‘luogo di attribuzione’ è
nel parlato letto complessivamente di scarsa entità e ha spinto a
ripetere il test ricorrendo a materiali di parlato semispontaneo: in
45 Peraltro già inferiore rispetto a //: il valore originario di F1 in esplodere è – lo ricordiamo – 515 Hz mentre il valore originario di F1 in perfetto è 449 Hz.
98
questa modalità d’eloquio, all’interno di enunciati di una certa
lunghezza, l’individuazione della provenienza è naturalmente più
facile, in quanto il parlante può attingere in contemporanea a più
indici acustici.
Il quadro emerso dai grafici relativi al parlato semispontaneo può
dunque essere riassunto attraverso le seguenti osservazioni:
a) la maggiore durata della vocale tonica manipolata è quasi sempre
indice di livornesità;
b) la minore durata della vocale tonica manipolata non è indice di
fiorentinità a Pisa, lo è talvolta a Livorno, lo è sempre a Firenze;
c) // e // mostrano comportamenti simili per quanto riguarda le
reazioni relative alla maggiore durata a Pisa; sono meno chiari i
risultati per // (nella vocale tonica allungata) a Firenze e a Livorno;
d) nel parlato semispontaneo, // è vocale più ‘bandiera’ di //46.
La presenza di due frasi con la stessa parola bersaglio, caratterizzata
da differenti valori per quanto concerne la modulazione di f0 e la
durata, permette anche di avanzare qualche rilievo a proposito del
complesso rapporto che investe la modulazione, la durata e l’apertura
vocalica, anche se siamo consapevoli del fatto che tale rapporto potrà
e dovrà essere meglio indagato in futuro, con un opportuno disegno 46 Nel valutare questo risultato, non sarà da ignorare un limite del disegno sperimentale: la scarsa riconoscibilità di // potrebbe essere dovuta anche alla posizione della parola so nella frase, collocata in una struttura di inciso. In genere, le prestazioni dei soggetti nei compiti di identificazione e di discriminazione tendono a essere migliori quando lo stimolo target è in posizione finale rispetto a quando si trova in una posizione interna (Liu & Kewley-Port 2004: 1230). Ad ogni modo, per
99
sperimentale. Ad ogni modo, la lettura delle distribuzioni percentuali
mostra le tendenze seguenti:
a) a Pisa la frase-stimolo originale con // più modulata e più lunga
(ma meno aperta) è giudicata più pisana della frase-stimolo originale
con // più aperta (ma meno modulata e più breve);
b) a Firenze la frase-stimolo originale con // più modulata e più
lunga (ma meno aperta) è giudicata più livornese della frase-stimolo
originale con // più aperta (ma meno modulata e più breve), che è
stata attribuita con percentuali più o meno simili a Pisa e a Firenze;
c) a Livorno la frase-stimolo originale con // più aperta (ma meno
modulata e più breve) è attribuita alla varietà di Firenze.
Ci potremmo chiedere allora se l’apporto comune di una più estesa
modulazione di f0 e di una maggiore durata possa rappresentare un
indice più potente degli abbassamenti vocalici per quanto concerne
l’identificazione della provenienza del parlante47. Per verificare questa
ipotesi sarà necessario estendere l’analisi anche a quei foni vocalici
che non risultano essere marcati nelle varietà pisana e livornese e,
soprattutto, costruire batterie sperimentali opportune, in cui siano
sistematicamente modificate f0 e durata. Nell’esperimento qui
la percezione della durata, gli studi rivelano una tendenza opposta, cui si fa cenno in § 4. 47 Questo primo risultato spingerebbe anche a fare qualche speculazione sulla priorità di indici prosodici rispetto a quelli segmentali nei compiti di riconoscimento: del resto è noto come le caratteristiche prosodiche siano il primo tratto fonetico che viene acquisito dal bambino (Crystal 1973), e come i parlanti siano in grado di riconoscere le lingue sulla base della sola prosodia (Ohala & Gilbert 1981).
100
descritto è stata manipolata una sola variabile alla volta, con una
notevole forzatura rispetto a quanto avviene nel parlato reale: la tappa
successiva del lavoro riguarderà la modifica di più variabili in
contemporanea. Proprio in questa direzione si muoveranno le nostre
indagini future, che intenderanno prendere in esame anche soggetti di
età differente, per valutare se campioni diversificati per età possano,
‘dalla parte del ricevente’, offrire prove relative a un sound change in
corso: dal momento che i fenomeni sotto osservazione hanno anche
una loro peculiarità diastratica, è possibile ipotizzare che soggetti
anziani di località ove la frattura giovani vs. anziani è nel vocalismo
particolarmente marcata (ad esempio a Pisa o a Cecina) reagiscano in
maniera differente rispetto a soggetti anziani di località ove tale
frattura è assente o rispetto a soggetti giovani che ricorrono a certi
andamenti formantici e prosodici anche per segnalare e ribadire la
propria peculiare identità48.
SILVIA CALAMAI & IRENE RICCI
Laboratorio di Linguistica, Scuola Normale Superiore, Pisa
[email protected]; [email protected]
48 Vd. a questo proposito Janson (1983; 1986).
101
Bibliografia Antonini F., Moretti, B. (2000) Le immagini dell’italiano regionale, Osservatorio
linguistico della Svizzera Italiana, Locarno: Dadò. Baroni, M.R. (1983) Il linguaggio trasparente. Indagine psicolinguistica su chi
parla e chi ascolta, Bologna: Il Mulino. Berruto, G. (1995) Fondamenti di sociolinguistica, Roma-Bari: Laterza. Berruto, G. (2002) Sul significato della dialettologia percettiva per la linguistica e la
sociolinguistica. In Atti del Convegno Internazionale Che cosa ne pensa oggi Chiaffredo Roux? Percorsi della dialettologia percettiva all’alba del nuovo millennio (M. Cini & R. Regis, a cura di), Bardonecchia, 25-27.V.2000, Alessandria: Edizioni dell’Orso, 341-360.
Brigato, S., Marotta, G. (2002) La modalità imperativa nell’italiano di Lucca. Prime linee di tendenza. In La fonetica acustica come strumento di analisi della variazione linguistica in Italia. Atti delle XIIe Giornate di Studio del GFS (in A. Regnicoli, a cura di), Macerata, 13-15.XII.2001, Roma: Il Calamo, 111-116.
Brown, B.L., Strong, W.J., Rencher, A.C. (1974) Fifty four voices from two: The effects of simultaneous manipulations of rate, mean fundamental frequency, and variance of fundamental frequency on ratings of personality from speech, JASA, 55, 313-18.
Calamai, S. (2001) Stili a confronto nel parlato toscano (Pisa e Firenze), L’Italia Dialettale, 2004, 62, 95-125.
Calamai, S. (2002) La percezione al quadrato in Toscana: pisani e livornesi. In Atti del Convegno Internazionale Che cosa ne pensa oggi Chiaffredo Roux? Percorsi della dialettologia percettiva all’alba del nuovo millennio (M. Cini & R. Regis, a cura di), Bardonecchia, 25-27.V.2000, Alessandria: Edizioni dell’Orso, 139-171.
Calamai, S. (2004a) Il vocalismo tonico pisano e livornese. Aspetti storici, percettivi, acustici, Alessandria: Edizioni dell’Orso.
Calamai, S. (2004b) Vocali fiorentine e vocali pisane a confronto. In Il parlato Italiano. Atti del Convegno Nazionale (F. Albano Leoni, F. Cutugno, M. Pettorino, R. Savy, a cura di), Napoli, 13-15.II.2003, Napoli: D’Auria, CD-rom, E02, 1-25.
Calamai, S., Ricci, I. (in stampa) Sulla percezione dei confini vocalici in Toscana: primi risultati. In Misura dei parametri. Atti del I convegno nazionale AISV (P. Cosi, a cura di), Padova, 2-4.XII.2004.
Calamai, S. (in prep.) Confini e atteggiamenti linguistici in Toscana. Canepari, L. (1999²) Manuale di pronuncia italiana, Bologna: Zanichelli. Cardona, G.R. (1988) Dizionario di linguistica, Roma: Armando. Carlson, R., Granström, B. (1975) Perception of segmental duration. In Structure
and process in speech perception (A. Cohen & S.G. Nooteboom, editors), Heidelberg: Springer-Verlag, 90-104.
Cini, M., Regis, R. (2002) (a cura di) Atti del Convegno Internazionale Che cosa ne pensa oggi Chiaffredo Roux? Percorsi della dialettologia percettiva all’alba del nuovo millennio, Bardonecchia, 25-27.V.2000, Alessandria: Edizioni dell’Orso.
102
Clopper, C.G., Pisoni, D.B. (2005) Perception of dialect variation. In The handbook of speech perception (D.B. Pisoni & R.E. Remez, editors), Oxford & Malden, Mass.: Blackwell, 313-337.
Crystal, D. (1973) Non-segmental phonology in language acquisition: A review of the issues, Lingua, 32: 1-45.
Cutugno, F., Savy, R. (1996) Percezione e categorizzazione di foni vocalici: adeguatezza delle procedure sperimentali. In Atti del XXIV Convegno Nazionale AIA (A. Peretti & P. Simonetti, a cura di), Trento, 12-14.VI.1996, Padova: Arti Grafiche Padovane, 179-182.
Dell’Aglio, M., Bertinetto, P.M., Agonigi, M. (2002) Le durate dei foni vocalici in rapporto al contesto nel parlato di locutori pisani: primi risultati. In La fonetica acustica come strumento di analisi della variazione linguistica in Italia. Atti delle XIIe Giornate di Studio del GFS (A. Regnicoli, a cura di), Macerata, 13-15.XII.2001, Roma: Il Calamo, 53-58.
Dell’Aglio, M. (2003) Ancora sulla durata vocalica in pisano. In La coarticolazione. Atti delle XIIIe Giornate di Studio del GFS (G. Marotta & N. Nocchi, a cura di), Pisa: ETS, 287- 294.
Dell’Aglio, M. (2004) Spunti sulla durata consonantica in pisano. In Costituzione, gestione e restauro di corpora vocali. Atti delle XIVe Giornate di Studio del GFS (A. De Dominicis, L. Mori, M. Stefani, a cura di), Università della Tuscia (Viterbo), 4-6.XII.2003, Roma: Esagrafica, 159-164.
Flanagan, J.L. (1955) A difference limen for vowel formant frequency, JASA, 27, 613-617.
Flanagan, J.L. (1957) Estimates of the maximum precision necessary in quantizing certain ‘dimension’ of vowel sounds, JASA, 29, 533-534.
Ganong, W.F. (1980) Phonetic categorization in auditory word perception, Journal of Experimental Psychology: Human Perception and Performance, 6, 110-125.
Gili Fivela, B. (2004) Phonetics and phonology intonation: The case of Pisa Italian, Tesi di Perfezionamento, Scuola Normale Superiore, Pisa.
Graff, D., Labov, W., Harris, W.A. (1986) Testing listeners’ reactions to phonological markers of ethnic identity: A new method for sociolinguistic research”. In Diversity and diachrony (D. Sankoff, editor), Amsterdam / Philadelphia: Benjamins, 45-58.
Huggins, A.W.F. (1972) Just noticeable differences for segment duration in natural speech, JASA, 51, 1270-1278.
Janson, T. (1983) Sound change in perception and production, Language, 59: 18-34. Janson, T. (1986) Sound change in perception: An experiment. In Experimental
phonology (J.J. Ohala, J.J. Jaeger, editors), Orlando Florida: Academic Press, 253-260.
Johnson, D.M., Watson, C.S., Jensen, J.K. (1987) Individual differences in auditory capabilities, JASA, 81, 427-438.
Kewley-Port, D. (2001) Vowel formant discrimination II: Effects of stimulus uncertainty, consonantal context, and training, JASA, 110, 2141-2155.
Kewley-Port, D., Watson C.S. (1994) Formant-frequency discrimination for isolated english vowels, JASA, 95, 485-496.
103
Kewley-Port, D., Zheng, Y. (1999) Vowel formant discrimination: Towards more ordinary listening conditions, JASA, 106, 2945-2958.
Klatt, D.H. (1976) Linguistic uses of segmental duration in English: Acoustic and perceptual evidence, JASA, 59, 1208-1221.
Klatt, D.H., Cooper, W.E. (1975) Perception of segmental duration in sentence context. In Structure and process in speech perception (A. Cohen & S.G. Nooteboom, editors), Heidelberg: Springer-Verlag, 69-86.
Ladefoged, P. (1984) ‘Out of chaos comes order’; Physical, biological, and structural patterns in phonetics. In Proceedings of the 10th International Congress of Phonetic Sciences (M.P.R. Van den Broecke & A. Cohen, editors), Dordrecht: Foris, 83-95.
Lehiste, I. (1970) Suprasegmentals, Cambridge Mass.: The MIT Press. Liu, C. & Kewley-Port, D. (2000), Vowel formant discrimination in natural speech,
JASA, 108, 2601. Makashay, M.J. (2003) Individual differences in speech and non-speech perception
of frequency and duration, PhD Dissertation, The Ohio State University. Marchi, V. (1993) Lessico del livornese. Con finestra aperta sul bagitto, Livorno,
Belforte. Marotta, G. (2001) Non solo spiranti. La ‘gorgia toscana’ nel parlato di Pisa, L’Italia
Dialettale, LXII, 27-60. Marotta, G. (2002) L’intonation des énoncées interrogatifs ouverts dans l’italien
toscan. In Proceedings of speech prosody, Aix-en-Provence, April 2002, 475-478.
Marotta, G., Nocchi, N. (2001) La liquida laterale nel livornese, Rivista Italiana di Dialettologia, 25, 285-326.
Marotta, G., Sorianello, P. (2001) La teoria autosegmentale nell’analisi dell’intonazione interrogativa in due varietà di italiano toscano (Lucca e Siena). In Dati empirici e teorie linguistiche. Atti del XXXIII Congresso SLI (F. Albano Leoni et al., a cura di), Napoli, 28-30.X.1999, Roma: Bulzoni, 177-204.
Marotta, G., Bertoni, E., Franceschi, R., Giuliani, M., Sorianello, P. (2002) Le occlusive sorde dell'italiano parlato a Pisa: varianti aspirate e fricative. In La fonetica acustica come strumento di analisi della variazione linguistica in Italia. Atti delle XXIIe Giornate di Studio del GFS (A. Regnicoli, a cura di), Roma: Il Calamo, 71-76.
Marotta, G., Sardelli, E. (2003) Sulla prosodia della domanda con soggetto postverbale in due varietà di italiano toscano. In Voce, canto, parlato. Studi in ricordo di F. Ferrero (P. Cosi et al., a cura di), Padova: Unipress, 205-212.
Marotta, G., Calamai, S., Sardelli, E. (2004) Non di sola lunghezza. La modulazione di f0 come indice sociofonetico. In Costituzione, gestione e restauro di corpora vocali. Atti delle XIVe Giornate di Studio del GFS (A. De Dominicis, L. Mori, M. Stefani, a cura di), Università della Tuscia (Viterbo), 4-6.XII.2003, Roma: Esagrafica, 215-220.
Mermelstein, P. (1978) Difference limens for formant frequencies of steady-state and consonant-bound vowels, JASA, 63, 572-580.
Micheli, P. (1897) Due poeti vernacoli livornesi, Conegliano: Cagnani.
104
Niedzielski, N. (1995) Acoustics analysis and language attitudes in Detroit. In (N)Waves and means (M. Meyerhoff, editor), University of Pennsylvania Working Papers in Linguistics, 3, 1, 73-86.
Niedzielski, N. (1999) The effects of social information on the perception of sociolinguistic variables, Journal of language and social psychology, 18, 1, 62-85.
Nocchi, N. (2002) Varianti della laterale nell’italiano di Livorno. In La fonetica acustica come strumento di analisi della variazione linguistica in Italia. Atti delle XIIe Giornate di Studio del GFS (A. Regnicoli, a cura di), Macerata, 13-15.XII.2001, Roma: Il Calamo, 77-82.
Nocchi, N. (2003) Vesto vì: un processo di rafforzamento in livornese?. In La coarticolazione. Atti delle XIIIe Giornate del GFS (G. Marotta & N. Nocchi, a cura di), Pisa: ETS, 221-232.
Nocchi, N. (2004) Laterali rafforzate e velarizzate? Ancora sulla velarizzazione della liquida laterale in livornese. In Costituzione, gestione e restauro di corpora vocali. Atti delle XIVe Giornate di Studio del GFS (A. De Dominicis, L. Mori, M. Stefani, a cura di), Università della Tuscia (Viterbo), 4-6.XII.2003, Roma: Esagrafica, 177-182.
Ohala, J.J., Gilbert, J.B. (1981) Listener ability to identify language by their prosody. In Problèmes de prosodie I (P.R. Léon, M. Rossi, ed.), Ottawa: Didier.
O’Shaughnessy, D. (1987) Speech communication. Human and machine, Reading etc.: Addison-Wesley.
Panzini, A. (1920 [1919]) Viaggio di un povero letterato, Milano: Treves. Pisoni, D.B. (1976) Fundamental frequency and perceived vowel duration, JASA,
59: S39. Preston, D.R. (1989) Perceptual dialectology, Dordrecht: Foris. Preston, D.R. (1997) The Northern Cities Chain Shift in your mind. In Issues and
methods in dialectology (A. Thomas, editor), Bangor, Wales: Department of Linguistics, University of Wales, Bangor, 37-45.
Preston, D.R. (in stampa) Dialects across internal frontiers: Some cognitive boundaries. In Proceedings of the XI international conference on methods in dialectology.
Ryan, E.B., Giles, H., Hewstone M. (1988) The measurements of language attitudes. In Sociolinguistics/Soziolinguistics (H.V.U. Ammon, N. Dittmar, K.J. Mattheier, editors), Berlin: de Gruyter, 1068-81.
Romanello, M.T. (2002) Sentire parole / percepire varietà. In Atti del convegno internazionale Che cosa ne pensa oggi Chiaffredo Roux? Percorsi della dialettologia percettiva all’alba del nuovo millennio (M. Cini & R. Regis, a cura di), Bardonecchia, 25-27.V.2000, Alessandria: Edizioni dell’Orso, 283-297.
Rosasco, G. (1777) Della lingua toscana dialoghi sette, Torino: Stamperia Reale. Sanminiatelli, B. (1972) Pisa e la sua terra, Pisa: Giardini. Smith, B.L., Brown, B.L., Strong, W.J., Rencher, A.C. (1975) Effects of speech rate
on personality perception, Language and Speech, 18: 145-152. Sorianello, P. (2001) Per una rappresentazione uditiva dei segmenti vocalici: il caso
del senese, Quaderni del Laboratorio di Linguistica della Scuola Normale Superiore, 2 (Nuova Serie), 159-173.
105
Sorianello, P. (2002) Il vocalismo dell’italiano senese: un’indagine sperimentale. In La fonetica acustica come strumento di analisi della variazione linguistica in Italia. Atti delle XIIe Giornate di Studio del GFS (A. Regnicoli, a cura di), Macerata, 13-15.XII.2001, Roma: Il Calamo, 47-52.
Thomas, E.R. (2002) Instrumental phonetics. In The handbook of language variation and change (J.K. Chambers, P. Trudgill, N. Schilling-Estes, editors), Oxford & Malden, Mass.: Blackwell, 168-200.
Turchi, L., Bertinetto, P.M. (2000) La durata vocalica di fronte ai nessi /sC/: un’indagine su soggetti pisani”, Studi Italiani di Linguistica Teorica e Applicata, 29, 3, 389-421.
Volkart-Rey, R. (1990) Atteggiamenti linguistici e stratificazione sociale. La percezione dello status sociale attraverso la pronuncia. Indagine empirica a Catania e a Roma, Roma: Bonacci.
Williams, A., Garrett, P., Coupland, N. (1999) Dialect recognition. In Handbook of perceptual dialectology (D.R. Preston, editors), Amsterdam/Philadelphia: Benjamins, I, 345-358.
Zuccagni Orlandini, A. (1864) Raccolta di dialetti italiani con illustrazioni etnologiche, Firenze: Tofani.