28/8/11

Tesina

La llenguaddicta està intentant analitzar les dades de la seva tesina de màster, però no se'n surt. El professor d'estadística també ho està intentant, i tampoc no se'n surt. ¿Serà que les aspiracions investigadores de la llenguaddicta són massa agosarades?

També cal tenir en compte diversos factors: 1. M'hi he posat tard. 2. No estic fent una tesina sobre la meva especialitat. 3. En aquests moments estic asseguda al terra de la meva antiga casa a Rochester (UK), mirant d'entendre una colla de números i de valors mentre a l'habitació del costat el meu ex-company de casa discuteix sobre l'entonació del xinès (via Skype) amb una companya de classe.

El factor 1 ja no té solució (a no ser que algú inventi la màquina del temps en les properes hores): vaig fer el ronso durant uns mesos, què voleu, era a Anglaterra amb un munt de coses per descobrir... El factor 2 tampoc no té solució a aquestes alçades: em vaig deixar convèncer per la meva supervisora, tot i que ella sap quina és la meva especialitat, perquè em va saber vendre la moto (a aquestes alçades, triar un altre tema, recollir unes altres dades, llegir unes altres desenes d'articles, és més que inviable). El factor 3 té solució (¿taps a les orelles? ¿canviar d'habitació?), però he de reconèixer que la lingüista que duc a dins no pot evitar parar l'orella quan algú crida amb alegria: "¡Ja entenc què fa aquest accent damunt d'aquesta vocal!"

Si no me'n surto amb la tesina, sempre puc dedicar-me al macramé.

6 comentaris:

RGAlmazán ha dit...

O también podrías aprender chino de oído.
Petons

Salud y República

llenguaddicta ha dit...

Je je...

Salut!

Lletraferit ha dit...

No has dit quin problema tens amb les dades. Potser et podem ajudar :-)

Quan he acabat de llegir el post i he vist que no en parlaves, m'he sentit ultratjat amb una probabilitat de 0.988 ;-)

llenguaddicta ha dit...

Tinc un grup de dades de 5 llengües de signes, en forma de freqüències, repartides en 2 factors amb 4 nivells per factor (creant així una taula de 16 categories). Cada freqüència està només en una de les categories. Vull saber: 1. si la diferència entre la quantitat de freqüències en un dels nivells (columnes a la meva taula de contingència) és significativament diferent de les altres, per a cada llengua de signes, de manera que pugui confirmar -o rebutjar- la teoria d'una altra persona que diu que aquesta diferència podria ser un paràmetre per a la classificació tipològica de les llengües de signes. 2. si el factor-línia (a la taula de contingència) té un efecte sobre el factor-columna.

No, no és X2 (chi-squared): amb això només puc saber si hi ha una associació entre els factors, però no en quin sentit (¿és A que causa B, o B que causa A?), i a més no puc contestar la pregunta 1 perquè chi-squared no informa sobre main effects.

El profe diu que l'anàlisi que he d'aplicar és generalized linear models, segurament amb una poisson distribution, potser amb una negative binomial distribution (si calgués corregir una possible overdispersion). Però a més tampoc té del tot clar que all the assumptions per a generalized linear model are met, per tant, cap dels resultats que estic obtenint de moment és fiable.

Un altre problema és que la meva mostra és petita en alguns casos, i SPSS no se'n surt a analitzar les dades (o bé per petita mostra, o bé per presència de valors 0).

¿Aclarit?

;)

llenguaddicta ha dit...

Per cert, Lletraferit, una probabilitat marginalment significativa la teva: no sé si prendre-la com a fiable o no. Hauria de fer-te un post-hoc test.

;)

Lletraferit ha dit...

Jaja, però el repte lingüísticament quin és? XD

A priori el que vols demostrar (la tesi d'aquest altre investigador que dius que has de refutar o corroborar) és trivial, qualsevol taula de freqüències et permet classificar un fenomen assumint que sigui (a) una mostra empíricament adequada (b) de dues o més distribucions estadísticament independents (si no és així, aleshores no us falla la fórmula sinó les assumpcions! XD). Si les premisses s'acompleixen, normalment no hauria de caldre ni que sortíssiu d'un naïve Bayes.

Ara sóc a la feina però després miro de respondre amb més temps perquè sembla un problema divertit :-) i perquè déu n'hi do quina quantitat d'insults que m'has dit ;-)

De totes maneres, sospito que, més que no pas resoldre un problema lingüístic, esteu intentant quadrar un conjunt de números ;-) sense acabar de preocupar-vos de veure d'on surten (si més no, a la teva descripció dels mesuraments he trobat a faltar una explicació més detallada!), i aleshores hauríeu de provar la fórmula que doni millors resultats amb el Tetris ;-)

Sisplau, si tens més informació sobre la hipòtesi lingüística que esteu revisant i sobre què mesuren les freqüències que esteu analitzant, sisplau digue-m'ho perquè hi pugui pensar.

Fins després!