Anàlisi de les llengües a la Wikipedia, demà a la Viquitrobada 2009 2 Octubre 02UTC 2009
Posted by xarxes in estadística, sociolingüística, sociologia.Tags: anàlisi, anglès, català, estadística, languages, lenguas, llengües, sociolingüística, trobada, viquipèdia, wikipedia, xinès
1 comment so far
Demà presentem a la trobada de Wikipedistes en català (Viquitrobada 2009) els primers resultats sobre la relació entre les variables socials i el desenvolupament de les llengües a la Wikipedia (abstract inicial). Volem trobar les raons per les que el xinès té a dia d’avui 274.271 articles (posició 12) i el català 201.945 (posició 15) (estadístiques). A ningú escapa la situació diferent del xinès i la del català. El primer té pràcticament 1.000 milions de parlants i el segon poc més de 9 milions. El primer es desenvolupa en una comunitat lingüística de contrastos socioeconòmics i el segon en una comunitat lingüística sòlidament assentada en la societat de la informació. El primer és oficial a una potència mundial i el segon només és cooficial en alguns territoris. I amb tot, tenen un número similar d’articles a la Wikipedia. Intentarem buscar resposta a la pregunta. I sobretot… ens trobarem moltíssimes preguntes més per a respondre.
Pensava que la correlació implica causalitat… 7 Març 07UTC 2009
Posted by xarxes in estadística.Tags: estadística, statistics
add a comment
Estadística: anàlisi discriminant 10 Novembre 10UTC 2008
Posted by xarxes in estadística.Tags: anàlisi discriminant, discriminant analysi, estadística, statistics
1 comment so far
Estic treballant amb una tècnica estadística que és l’anàlisi discriminant. Us faig una guia ràpida sobre com treballar-hi i entendre-la. Com és evident, si voleu treballar la tècnica bé i entendre-la al complet, us recomano que llegiu bibliografia especialitzada.
Casos en que s’utilitza l’anàlisi discriminant: tenim una variable dependent qualitativa, preferentment dicotòmica (per exemple, sí o no) i una o diverses variables independents quantitatives.
Excepcions: si tenim una variable qualitativa entre les independents, cadascun dels valors de la variable qualitativa podem convertir-lo en una variable dummy (sí / no) i convertir així la variable qualitativa original en tantes noves variables dummy com categories tenia l’orginal. Si ho heu de fer, reviseu la bibliografia especialitzada.
Interpretació sociològica: l’anàlisi discriminant dibuixa la millor funció (línia) que distingix entre categories de la variable dependent. Si per exemple analitzem els catalanoparlants inicials que transmeten el català als fills i els que no ho fan, amb la funció descrita per l’anàlisi discriminant obtindrem la millor manera de discriminar els uns dels altres.
Anàlisi amb SPSS i interpretació dels resultats: (treballem amb la versió 14 (castellà) del SPSS). Analizar > clasificar > discriminante. A la nova finestra posem la variable dependent a variable de agrupación i defnim el rang (habitualment li direm que les categories possibles van del mínim 1 al màxim 2). I les variables independents les posarem a independientes. Els principals resultats que ens dona el SPSS són:
- Nombre de casos vàlids: vigilem que no estiguem perdent molts casos que no tenen resposta a totes les variables. Si els estem perdent, podem fer una nova variable substituint els casos perduts per la mitjana, per exemple.
- Al resum de funcions canòniques discriminant mirem el valor de la Correlación canònica. A partir de 0,7 es considera un valor acceptable i a partir de 0,8, alt. Confirmem que la signifiació de la correlació és la necessària: a la Lambda de wilks confirmem que la Sig. siga menor a 0,05.
- Al final de tot mirem la matriu d’estructura, que ens indica quines són les variables més importants per a la discriminació entre una categoria i l’altra de la variable dependent.
- Tenim la possibilitat que el SPSS només tinga en consideració les principals variables discriminants. Això ho podem indicar a la casella de Analizar > clasificar > discriminante, on hi ha una opció que diu Usar método de inclusión por pasos.
Referència principal utilitzada: Ferrán Aranaz, Magdalena (2001) SPSS para windows. Análisis estadístico. Aravaca: Ed. Osborne McGraw-Hill.
Tindre un cognom poc comú et pot fer més ric 3 Octubre 03UTC 2008
Posted by xarxes in tesi.Tags: apellidos, cognoms, estadística, sociologia, sociology, statistics, surnames
add a comment

Començo a pensar en les coses més importants que es poden explicar sobre la demolingüística, per a transmetre-les a una classe de postgrau per a gent que no té per què estar interessada en la sociolingüística. La línia central consistirà en com es poden llegir les enquestes i els seus resultats. I sobretot, en com es pot llegir críticament la premsa i alguns acadèmics quan parlen de dades demolingüístiques. Per exemplificar-ho, tinc los ulls més oberts que mai quan parlen d’enquestes. I em trobo articles que tenen la clau per a ajudar-me:
Las personas con apellidos poco comunes tienen un nivel socioeconómico mayor
Ho deia ahir 20 minutos, que explica periodísticament els resultats de l’estudi Surnames and social status in Spain d’investigadors d’Alacant, Múrcia i Madrid. La metodologia utilitzada consistix en relacionar els cognoms de la guia telefònica “general” i els de la guia de pàgines grogues, tenint en compte les professions (indicatiu d’estatus), tals com farmacèutic/a o advocat/ada. I evidentment, el titular (no els investigadors) destaca una relació entre cognoms poc comuns i nivell socioeconòmic. De fet, els resultats que s’hi apunten indiquen clarament això:
Los investigadores encontraron que en las profesiones prestigiosas el número de personas que las ejercen y que portan apellidos comunes es un 20 por ciento menor que en otras profesiones.
Evidentment, quan hi ha relació, el següent pas és veure d’a on ve esta relació (la direccionalitat de l’associació).
- No és factible la interpretació de què tindre un poder adquisitiu superior et crea un cognom menys comú. Perquè sabem que el cognom s’hereta, i a més, en un ordre ben establert que en pocs casos es canvia.
- Sí que és factible, però erroni, interpretar que tindre un cognom poc comú et dona més possibilitat per a ser més ric. Això, de fet, és el que podria estar intentant transmetre inconscientment la notícia.
“Hay menos García, Alonso, López y otros apellidos comunes entre las personas con mayor estatus social que lo que debería observarse si no existiera el sesgo que aquí detectamos”, afirma Ortuño que pone como ejemplo los apellidos de los profesores universitarios españoles que “presentan este sesgo de forma significativa”.
- El més cautelós és incorporar l’efecte de terceres variables. Qüestions que no es tracten a l’article de 20 minutos interferixen l’anàlisi, i si no es tenen en compte ens poden portar a conclusions simplistes i errònies. Si incorporàrem a l’anàlisi la variable “professió dels pares“, “estatus socioeconòmic dels pares” i/o “estudis dels pares” (que són dades no disponibles a la guia de telèfons, també ho sabem) la relació entre cognom i estatus socioeconòmic s’esbandiria quasi al complet. El cognom, per si sol, no aporta facilitats per a exercir de farmacèutic. El que realment importa és el llinatge social i econòmic. La capacitat dels pares per pagar una (bona) universitat al fill. I sobretot en els professionals de més edat, quan la universitat era un distintiu encara més fort de classe. El cognom és més un marcador d’eixe llinatge distingit (herència generació rere generació de l’antic règim) que una variable dependent per si mateixa. Tot això, és clar, s’ha de comprovar. I és difícil amb els instruments de mesura disponibles.
A l’estudi també incorporen l’anàlisi dels cognoms dels electes a les llistes dels partits polítics. Inidiquen que tant els estatalistes (PP i PSOE) com els nacionaliste perifèrics (on no distingeixen progressistes de conservadors) tenen una clara distància amb la realitat dels cognoms espanyols. Qui té distàncies més importants és el PP. I amb menor distància, hi ha els nacionalistes, i també el PSOE. Qui no té diferències significatives és Esquerra Unida.
El Foto de nava1963

