29/8/11

Tesina, segon capítol

A petició del Lletraferit, aquí teniu el rotllo del segle: de què va la meva tesina.

Carol Padden va presentar l'any passat en una conferència un projecte de recerca (no hi ha article publicat) en el qual afirmava que les llengües de signes (LLSS) tenen una forta preferència (pel que fa als signes que denoten objectes que fem servir amb les mans: e.g. raspall de dents) a generar signes amb una configuració manual (CM)* o bé de manipulació o bé d'instrument (seguint amb l'exemple, RASPALL-DE-DENTS amb una CM de manipulació seria amb el puny tancat, l'índex i el polze tocant-se 'com si agafessis un raspall de dents'; mentre que amb una CM d'instrument seria amb el puny tancat, l'índex completament estirat 'com si el dit fos el raspall de dents').

Està clar que les LLSS fan un ús molt extens de la iconicitat*, perquè els articuladors* així ho permeten: és més fàcil representar amb les mans el món que ens envolta -basant-nos en trets físics tangibles, e.g. l'ús que en fem -o la forma que té- un raspall de dents, per a crear el substantiu RASPALL-DE-DENTS, o el verb RASPALLAR-SE-LES-DENTS, en les LLSS-, que no pas representar-lo amb la veu havent-nos de basar en els trets sonors d'aquesta mateixa realitat (en català, doncs, "raspall de dents" hauria de ser quelcom com "xxxfffxxx glglglglg"). Les llengües orals, per tant, són menys icòniques que les de signes, però no vol dir que no ho siguin gens: mentre que el català i el castellà en fan un ús poc lingüístic ('quiquiriquí' és el so del gall, però no significa 'gall'), l'anglès en fa un ús més ampli (slam és un mot -que pot ser verb o substantiu- que significa tancar la porta de cop, perquè aquest és el soroll que fa més o menys una porta en tancar-se).

Havent dit tot això, us explico la pel·lícula: l'estudi de la Carol Padden va aixecar gran rebombori en el món dels signolingüistes*, bàsicament per dos motius: 1. En la seva conclusió va suggerir aquest paràmetre morfo-fonològic (CM de manipulació vs d'instrument) com a possible classificació tipològica de les LLSS, i 2. el seu estudi es basa en només 27 paraules comparades en 6 llengües de signes (els seus resultats, doncs, són força discutibles: és com si ara jo agafés -m'ho invento- 27 paraules del català (de les quals casualment 19 són aglutinants), i amb això conclogués que el català és una llengua aglutinant).

La meva supervisora em va proposar de generar una llista d'objectes d'ús manual més extensa que la de Padden, agrupar els objectes en grups diferents, i buscar en diccionaris de diverses LLSS aquestes paraules, tot classificant-les segons la CM. La meva llista de mots conté 155 objectes, classificats en 4 grans grups -inicialment amb subgrups, però els he acabat fusionant:

1. Eines i estris
2. Menjar
3. Roba i complements
4. Higiene i cosmètica

I estan classificats en 4 tipus de CM -inicialment amb subgrups que també he acabat fusionant:

1. Manipulació
2. Instrument
3. SaSS*
4. Altres

Tinc 5 llengües de signes:

British Sign Language (BSL)
New Zealand Sign Language (NZSL)
Hong Kong Sign Language (HKSL)
Lengua de Signos Española (LSE)
Llengua de Signes Catalana (LSC)

Com era d'esperar, no tots els diccionaris contenen les 155 paraules de la meva llista, però això no representa un problema estadísticament. Tinc 5 grups de dades independents (un per a cada LLSS) i un 6è grup de dades que anomeno "common data set", que són les úniques 36 paraules que he trobat en tots 5 diccionaris.

Ara és on comença la part que fa por: les meves preguntes de recerca.

1. ¿És la diferència entre una CM i les altres significativa, per a cada llengua de signes? És a dir, ¿mostren les meves dades que les LLSS tenen una forta tendència cap a Manipulació o cap a Instrument, tal com Padden afirma? (e.g. si trobés que un 85% dels signes de BSL són de manipulació, comparat amb un 10% d'instrument, un 3% de SaSS i un 2% d'altres, podria dir que BSL té una forta tendència a generar signes de manipulació pel que fa als signes que denoten objectes manuals).

2. El tipus d'objecte, ¿té un efecte en la CM? És a dir, ¿es dóna el cas, per exemple, que les LLSS tendeixin a fer 'Eines i estris' amb una d'aquestes dues CM més "fortes" (manipulació / instrument), mentre que 'Roba i complements' potser es representa majoritàriament amb una altra CM? Si aquest fos el cas, les conclusions de Padden només s'apliquen a un tipus molt reduït de mots dins d'un tipus de mots que ja de per sí és reduït. (¿M'explico?)

I conte contat, ja s'ha acabat.

Vaig començar amb chi-squared perquè no veia cap altra opció: freqüències independents, quantitats desiguals en cada cel·la de la meva graella, d'alguna manera el que m'interessa anar a mirar són proporcions, i si aquestes proporcions són significativament diferents. Però Pearson no em respon a cap de les preguntes (i no només perquè ja és mort), perquè només informa d'associacions entre factors, però no en quin sentit és l'associació.

El profe d'estadística (aka Stats Superhero), li ha estat donant moltes voltes, i al final ha decidit que el millor era aplicar un anàlisis de models lineals generalitzats (aix, que em sona raro això en català, en diré GZLM a partir d'ara). Depenent de si fem servir una distribució Poisson o una Negative Binomial, obtinc resultats diferents. A més, si intento analitzar els 5 grups de dades per separat, SPSS (el programa d'anàlisi estadística) es torna boig, per tant, només puc fer-ho si analitzo totes les dades alhora, la qual cosa em fa l'efecte que em fa perdre-hi fidelitat. Per a més inri he hagut de carregar-me la categoria 'Higiene i cosmètics', perquè en els diccionaris hi ha tan poques entrades que m'esguerra tota l'anàlisi.

Les assumpcions de GZLM són força complexes, i és per això que el profe s'ho està mirant. Jo, tret de fer l'anàlisi tal com ell m'ha ensenyat i mirar d'entendre'n els resultats, poca cosa més puc fer: espero resposta d'ell per tal donar per bons els resultats que de moment he trobat i tirar endavant (i.e. escriure d'una punyetera vegada la tesina dels trons), o bé dedicar-me al macramé.

Lletraferit, espero que amb aquestes dades en tinguis prou per a donar-li unes quantes voltes. Ja em diràs el què.


*Glossari:

Configuració manual: un dels trets fonològics (i.e. distintius) de les llengües de signes. És la selecció de dits -i la seva posició- en la representació d'un signe. Els altres trets fonològics són moviment i ubicació (e.g. moviment des del cos cap enfora, circular, de dalt a baix; ubicació: a la zona del cap, del tors, en contacte, sense contacte...).
Iconicitat: representació de la realitat basada en trets físics o conceptuals de la mateixa.
Articuladors: l'aparell fonador, en les llengües orals; mans, tors i cara, en les llengües de signes.
Signolingüista: friki entre frikis.
SaSS: Size and Shape Specifiers (especificadors de forma i mida). Són uns signes abastament estudiats, on les mans tan sols denoten el contorn de l'objecte, basant-se en la mida i la forma.

7 comentaris:

El veí de dalt ha dit...

Bufa Manela!

llenguaddicta ha dit...

Ha ha ha!

Lletraferit ha dit...

(I)
Si arribo a saber que ens fotries aquest rotllo no et dic res XD En fi, ara ja he après. El puc que n'he pogut treure en clar:

1. Ometo la digressió amb la comparació entre la iconicitat de les llengües de signes i la de les orals perquè entenc que t'ha sortit de l'ànima però no és estrictament rellevant per al problema que ens ocupa :-)

2. Dius Va suggerir aquest paràmetre morfo-fonològic (CM de manipulació vs d'instrument) com a possible classificació tipològica de les LLSS. No conec el tema i no tinc cap raó per estar-hi d'acord o en contra, però em permeto fer-te notar la semblança amb el conegut fenomen de la lexicalització de la manera, diferent en llengües romàniques i germàniques (gran Talmy!). És el famós exemple de l'anglès, "roll into the room" oposat a la variant romànica, "entrar en l'habitació rodolant", segons si el nucli sintàctic (el verb principal) expressa la manera en què es fa l'acció o bé el seu resultat. El primer cas (manera) equival clarament a la idea de manipulació de la CM de les llengües de signes, per bé que s'oposa al corresponent efecte en comptes d'un hipotètic objecte. Ara, això és així perquè parlem d'una acció de moviment, si comparem efectivament amb els instrumentals, aleshores ja es veu més clar: compareu l'anglès "they hammered it flat" amb el castellà "el van aplanar amb un martell": en el primer cas, el substantiu es transforma funcionalment en un verb i designa la manera (per tant, equivalent al CM de manipulació); en el segon cas, el substantiu es manté funcionalment com a tal i designa l'objecte (per tant, equivalent al CM d'instrument).

Lletraferit ha dit...

(II)
A partir d'aquest exemple sembla clar que hi ha paral·lelismes entre llengües orals i de signes, i en Ciència Cognitiva s'accepta que aquest model de Talmy és generalment correcte i permet traçar una distinció entre llengües romàniques i germàniques, de manera que (1) la distinció tipològica que hi veu la Carol Padden no em sembla pas forassenyada, (2) seria molt interessant veure si aquesta divisió entre llengües romàniques i germàniques és el que s'ha trobat a les corresponents llengües de signes (si tant les orals com les de signes obeeixen el patró però els seus orígens són independents -com en principi crec que és inqüestionablement cert-, aleshores seria un interessant cas de variable cultural que està influint en l'estructura lingüística a un nivell més essencial que la pròpia tipologia de les llengües!), (3) segurament aquest tret no permeti discriminar entre p.ex. LSE i LSC, però possiblement sí entre p.ex. HKSL i BSL i (4) fins i tot si no és un tret de classificació tipològica (com entenc que no ho seria si es confirmés (2)), sembla un tret de classificació cognitiva, que és molt més interessant :-)

3. Dius "el seu estudi es basa en només 27 paraules comparades en 6 llengües de signes (els seus resultats, doncs, són força discutibles: és com si ara jo agafés -m'ho invento- 27 paraules del català (de les quals casualment 19 són aglutinants), i amb això conclogués que el català és una llengua aglutinant)", i t'entenc :-), però compte, pensa que la Carme Junyent ja te n'ha parlat, de fer servir un inventari reduït de signes per jutjar la semblança entre llengües :-) El vocabulari bàsic de Swadesh es va aplicar en Lingüística Històrica i Antropologia Lingüística i va permetre treure algunes conclusions. Després s'ha abandonat, però sembla que un estudi posterior l'ha reprès amb un èxit parcial, vid. referència a Gray and Atkinson (2003) que dóna la Wikipedia, http://lmo.wikipedia.org/wiki/Swadesh_list.

Evidentment, com més exemples i més dades, sempre millor, però una mostra reduïda només és parcial si hi ha raons per pensar que, pel fet de ser reduïda, pugui ser incompleta. En canvi, una mostra pot ser petita i ser adequada segons el fenomen que es vulgui analitzar: p.ex. els resultats dels estudis clínics tenen més pes com més gran és el nombre de subjectes perquè la variació es produeix efectivament a nivell individual (nivell socioeconòmic, historial clínic, antecedents familiars, alimentació, escolarització, zona de residència i condicions sanitàries que s'hi donen, etc. -hi ha tantes variables amagades que, perquè s'anul·lin unes a altres i els resultats siguin fiables, les tendències s'han de complir a un nivell proporcionalment molt més gran); en canvi, als estudis p.ex. genètics que analitzen les poblacions humanes, normalment n'hi ha prou amb seqüenciar el genoma d'un grapat de subjectes de cadascun dels grans grups ètnics actuals (p.ex. -i m'ho invento una mica- caucàsics, asiàtics, austronèsics, afroamericans i indígenes americans) perquè, en tractar-se de genomes, substancialment idèntics dins de tot el col·lectiu, la variació individual és relativament menor i negligible a efectes de l'estudi: com s'estudien gens específics que serveixen de marcadors i que són estables i invariables entre individus, no en calen molts. Si tinguéssiu raons per pensar que la llista de paraules que heu fet servir per a l'estudi és el "vocabulari bàsic", i.e. aquests "gens" que voleu estudiar, aleshores és molt possible que ja estigui bé.

Si el teu gurú de les estadístiques hi estigués d'acord (però podria no estar-ho perfectament ;-), jo no he arribat a fer recerca a aquest nivell!), entenc que us hauria de servir qualsevol mesura de rellevància que s'apliqui per avaluar la significança als estudis genètics al camp de l'antropologia evolutiva (p.ex. la recerca que fan al Max Planck Institute).

Lletraferit ha dit...

(III)
4. Dius "1. ¿És la diferència entre una CM i les altres significativa, per a cada llengua de signes? És a dir, ¿mostren les meves dades que les LLSS tenen una forta tendència cap a Manipulació o cap a Instrument, tal com Padden afirma?". Jo crec que la correlació Pearson t'hauria de servir (però li posaria directament el màxim, 0.37, perquè si acceptem que heu trobat la llista de Swadesh de la Configuració Manual ;-), aleshores l'efecte que mesureu hauria de satisfer aquest llindar o altrament no em semblaria gens convincent). Ara, m'has confòs perquè descartes Pearson, però primer dius:

... Pearson no em respon a cap de les preguntes (...) perquè només informa d'associacions entre factors, però no en quin sentit és l'associació...

i després dius:

No, no és X2 (chi-squared): amb això només puc saber si hi ha una associació entre els factors, però no en quin sentit

Entenc que en el segon cas parles tota la estona de khi quadrat, però aleshores li atribueixes el teu problema a dues tècniques diferents. En què quedem? :-) O totes et donen el mateix problema? XD Jo crec que hauries de poder fer servir Pearson o semblant.

5. Per últim, escrius "El tipus d'objecte, ¿té un efecte en la CM? És a dir, ¿es dóna el cas, per exemple, que les LLSS tendeixin a fer 'Eines i estris' amb una d'aquestes dues CM més "fortes" (manipulació / instrument), mentre que 'Roba i complements' potser es representa majoritàriament amb una altra CM? Si aquest fos el cas, les conclusions de Padden només s'apliquen a un tipus molt reduït de mots dins d'un tipus de mots que ja de per sí és reduït. (¿M'explico?)". T'expliques i és força interessant :-), però jo ja he d'anar a dormir :-) Ara: no entenc el teu dubte relatiu a la direcció de la causalitat. Quan preguntes si A causa B o a l'inrevés, què és A i què és B? Pel que he entès, tu vols saber (1) si la variable 'llengua' condiciona la variable CM i (2) si el tipus d'objecte condiciona la variable CM, però en aquest cas la primera no és "l'inrevés" de la segona (i.e. la direccionalitat és irrellevant) perquè els dos parells de variables són diferents. Què no HE entès!? :-) De la direccionalitat entre quins dos factors/variables estem parlant???

Joan ha dit...

Caram, m'he llegit fil per randa apunts i comentaris i m'ha agafat tal contractura a la mandíbula que ara no em veig capaç de tancar la boca.

M'ho hauria de tornar a mirar de dalt a baix amb calma i com que no sé si us podria ser d'utilitat, quasi que m'estimo més cedir-vos els honors. Però molt em temo que en Lletraferit té raó en entendre que les paraules no són números i que, per tant, n'hi ha de més significatives que d'altres.

Sempre s'ha dit que un parlant utilitza un vocabulari d'entre 3 i 5 mil paraules. Les teves 155 serien, doncs, entre un 3,10% i un 5,17% d'aquesta mostra. Probablement el "nucli bàsic" de paraules utilitzades sigui molt inferior a aquestes 3-5 mil i per tant estariem parlant d'un percentatge major sempre que les teves 155 paraules fossin d'aquest "nucli". Per tant, amb condicionants, però jo diria que les teves conclusions poden ser força rellevants.

llenguaddicta ha dit...

Seré molt breu, perquè encara m'estic barallant amb les dades.

1. No, no es tracta de vocabulari bàsic (ni del vocabulari "bàsic" de la categoria semàntica d'objectes que fem servir amb les mans, ni del vocabulari "bàsic" dels signes de Manipulació...).

2. Tinc 4 tipus de resultats diferents, dos dels quals diuen que sí (que les llengües de signes tendeixen a Manipulació o a Instrument), i els altres dos em diuen que no.

3. Quan surti del laberint us ho explico :S