jump to navigation

N. Sorolla: Mesurar els grups sociolingüístics. Catalunya i les Balears: les transformacions més rellevants 18 Desembre 18UTC 2017

Posted by xarxes in estadística, sociolingüística.
Tags: , , ,
add a comment

This post is also available in: English

Natxo Sorolla
Universitat Rovira i Virgili, Xarxa CRUSCAT-Institut d’Estudis Catalans i
Centre de Recerca en Sociolingüística i Comunicació (CUSC) de la Universitat de Barcelona

Amb Xavier Vila portem treballant algun temps amb els grups sociolingüístics. Els usos lingüístics d’una mateixa persona poden variar molt d’un àmbit a unt altre: es pot parlar català a casa, català i castellà amb els amics en una proporció bastant similar, només castellà amb el metge, i només català amb la persona que ens atén al banc. La idea que hi ha al darrere dels grups sociolingüístics és crear un índex d’ús del català parlat en 10 àmbits (IUP-10), que considerem que és molt més fi que no preguntes més generals com llengua habitualpercentatge d’ús en les interaccions quotidianes. La idea té cert paral·lelisme amb els estudis sobre la felicitat, i sobretot, la proposta que Daniel Kahneman, l’únic psicòleg amb premi Nobel, proposa al voltant de les polèmiques que acompanyen els estudis d’Easterlin, sobre si els diners fan la felicitat (vegeu aquest capítol excel·lent del programa de divulgació Economia en colors). Les discussions es fan al voltant de com mesurar la felicitat, i com n’és de diferent si ens pregunten el nostre estat de felicitat, en general, en oposició a si la felicitat es mesura moment a moment. D’alguna manera, quan ens pregunten sobre els records de felicitat som més generosos amb la nostra vida que no pas quan hem d’apuntar cada moment de felicitat, perquè tot i que pensem que som força feliços (en general), bona part del nostre dia passa per situacions d’estrès, tristesa, o avorriment. D’alguna manera, la idea que nosaltres apuntem en sociolingüística és que, més enllà del record que tenim sobre l’ús que fem de les llengües, és molt més útil mesurar i sintetitzar quina llengua parlem en àmbits o interlocutors concrets, com la llengua usada amb els amics, amb la parella, amb els fills, amb els veïns, als grans establiments comercials… La primera forma de mesurar la felicitat segur que està més relacionada amb el que voldríem fer, més que no pas la segona, que ha de ser més realista amb el que realment fem. Continuar llegint… Mesurar els grups sociolingüístics. Catalunya i les Balears: les transformacions més rellevants | Càtedra Unesco de Diversitat Lingüística i Cultural

Anuncis

Xarxes de targetes de crèdit per detectar comunitats urbanes 27 Novembre 27UTC 2017

Posted by xarxes in estadística, xarxes.
Tags: , , , , , ,
add a comment

Gràfics d’interacció econòmica entre punts de la ciutat: Madrid superior esquerra, Ciutat de Mèxic superior dreta, Barcelona inferior

Al BBVA urban discovery han mostrat fins on pot arribar la conjunció de les dades massives (big data) i les xarxes socials. Sintetitzant el projecte, divideixen la ciutat en hexàgons de 200m de lateral. Quan en un espai de temps de 3 hores una mateixa targeta de crèdit fa operacions econòmiques en àrees geogràfiques diferents es dibuixa un lligam entre hexàgons, destacant que són punts de la ciutat per on la mateixa persona fa despeses. Evidentment, això crea una xarxa entre diferents localitzacions de la ciutat que visualment no revela res.

“Comunitats” socioeconòmiques a Barcelona

Posteriorment apliquen anàlisi de comunitats, que permet observar com s’organitza la ciutat, si més no, en despeses econòmiques. I comparen aquesta realitat amb la realitat administrativa de les ciutats. A la imatge podeu veure en colors les comunitats detectades a Barcelona, i en línies, els districtes oficials.

Finalment, desenvolupen anàlisis més aprofundides sobre quin tipus de despesa es fa, i a partir de l’edat, els usos, el dia de la setmana i l’hora, detectant zones laborals i empresarials, residencials, populars… El millor és que feu una ullada a:

  1. L’article de premsa que sintetitza els resultats.
  2. L’article que explica com defineixen les comunitats a partir de l’anàlisi de xarxes
  3. L’article amb l’anàlisi d’aquestes comunitats
  4. La web del projecte, on podeu jugar amb les dades. Vigileu: no perdeu de vista el botó amb la fletxa cap a baix, perquè no és intuïtiu, i si no us quedareu aturats al primer mapa de xarxes :)

 

Per què no vehiculem la recerca demolingüística? 9 Novembre 09UTC 2017

Posted by xarxes in ciència, estadística, sociolingüística.
Tags: , , ,
1 comment so far

LSCLa revista Llengua, Societat i Comunicació, del CUSC-UB, ha publicat un monogràfic sobre demolingüística. La revista sobretot està dirigida a la divulgació de recerca sociolingüística. Haig tingut l’honor de coordinar-ne els continguts. lsd2I haig xalat molt aprofundint en una subdisciplina que m’apassiona, sobretot quan es pot ampliar el focus més enllà de l’anàlisi descriptiva, fent ciència: intentant entendre per què el món social és com és. La demolingüística  té un espai perifèric a la recerca internacional. I a pesar d’això, habitualment l’acompanya una remor que li suposa una centralitat inexistent. Esta realitat internacional afecta, i molt durament, sobre la recerca demolingüística d’aquí. Però convertim les debilitats en oportunitats: als territoris de llengua catalana es té un gran potencial metodològic i teòric. Si hi posem voluntat, podem vehicular la recerca demolingüística internacional. Fem que hi aposten les entitats acadèmiques. En tot cas, feu boca fent una ullada als continguts del número. I per a reflexionar sobre el passat, el present, i el futur de la subdisciplina, us enganxo el text de presentació del monogràfic.

La recerca demolingüística: estat de la qüestió i futur

Natxo Soroll. CUSC–UB. Xarxa CRUSCAT–IEC. Universitat Rovira i Virgili. natxo.sorolla@urv.cat

1. La demolingüística

La revista Llengua, Societat i Comunicació destina el seu esforç a la divulgació dels estudis que es troben en la intersecció dels tres camps que li donen nom. Dediquem aquest monogràfic a la demolingüística. Aquesta subdisciplina, que també denominem demografia de la llengua, analitza la situació sociolingüística de grans volums poblacionals, i la seua evolució, mitjançant les tècniques demogràfiques i sociològiques. Aquest volum presenta l’estat de la qüestió per a un públic interessat en aquesta recerca, però que no necessàriament n’ha de ser especialista. En el monogràfic es plantegen reflexions sobre el desenvolupament de la recerca demolingüística, evitant focalitzar-se només en els resultats de les recerques. Els articles tenen un format curt, i amb intenció divulgativa.

(més…)

Presentació de “Lingua e sociedade en Galicia. A evolución sociolingüística 1992-2013” 6 Juny 06UTC 2017

Posted by xarxes in estadística, sociolingüística.
Tags: , ,
add a comment

Ham mantingut uns intercanvis molt interessants en Xaquín Loredo, del Seminari de Sociolingüística del gallec, sobre com ham elaborat los grups sociolingüístics en l’anàlisi de diferents enquestes, com l’EULP13. La propera setmana en presenten los resultats de la seua aplicació al gallec. Una bona notícia!

logo-RAG-150.jpgA Real Academia Galega acollerá o vindeiro luns, 12 de xuño, ás 11 horas, a presentación en rolda de prensa do volume Lingua e sociedade en Galicia. A evolución sociolingüística 1992-2013. O traballo, elaborado no seo do Seminario de Sociolingüística da RAG, achega unha visión panorámica da situación da lingua galega e sinala as tendencias que marcan a súa evolución desde a década dos noventa ata o momento actual.

Font: Seminario de Sociolingüística, Real Academia Galega (RAG), academia.gal

Instal·lant SPSS a Linux 8 Mai 08UTC 2017

Posted by xarxes in ciència, estadística.
Tags: , , , , , , ,
add a comment

Migrar al software lliure és complicat. I molts dels problemes venen perquè estem immersos en un ecosistema Windows. Si des de menuts partirem des d’Ubuntu, LibreOffice, R… no mos trobaríem molts dels problemes. En tot cas, faig unes instruccions/guia per a usar SPSS en Ubuntu (en lo meu cas, Kubuntu), que seran d’utilitat per a sociòlegs i altres quantitativistes:

  1. Instal·lar VirtualBox per a Linux, a on posarem un Windows (per exemple el 10)
  2. Quan engeguem Windows, instal·lar un SPSS 20 que funciono, i seguir la resta de passos d’instal·lació que faríem en Windows, especialment lo pas posterior copy “lservrc” into the installed dir (e.g. C:\Programme\IBM\SPSS\Statistics\20)

Fer-ho en VirtualBox permet fer funcionar un sistema operatiu dins d’un altre, i per tant, hi ha compatibilitat completa. Vaig intentar resoldre el tema per via de Wine, que fa funcionar programes de Windows dins Ubuntu, i per tant, fa un ús menor de recursos. Però no es veig resultats, etc. En tot cas, penjo les instruccions més avall.

Hi ha versions natives de SPSS en Linux, però les instruccions no m’han funcionat. Si voleu fugir del programari propietari, una bona alternativa senzilla és PSPP, de codi lliure, i que va en Ubuntu i Windows. Aquí teniu algunes explicacions d’utilitats per a les classes de Tècniques Quantitatives per a Treball Social, a la Universitat Rovira i Virgili. Una alternativa futura és R, i sobretot entorns que el simplificon, com Deducer. Però no m’hi veig en cor, encara… Si teniu algun dubte, ja sabeu, als comentaris en podem parlar.

 

(més…)

N. Sorolla (30/3/17, Perpinyà): Demolingüística de la llengua catalana: un repte a tots els territoris de llengua catalana 29 Març 29UTC 2017

Posted by xarxes in estadística, sociolingüística.
1 comment so far

En el marc de les classes que faig a la Universitat de Perpinyà, demà dijous hi ha una sessió oberta sobre demolingüística dels territoris de llengua catalana.

Dijous 30 de març, a 17h30, té lloc a Casa dels Països Catalans de la Universitat, la conferència Demolingüística de la llengua catalana: un repte a tots els territoris de llengua catalana per Natxo SOROLLA, especialista de sociolingüística, professor associat a la Universitat Rovira i Virgili de Tarragona Reus i coordinador al si de la xarxa CRUSCAT (Coneixement, representacions i usos del català, de l’IEC) de l’Informe anual sobre la llengua catalana. La conferència té lloc en el marc del cicle de conferències de la Llicenciatura d’Estudis Catalans. És oberta a les persones interessades.

N. Sorolla: El potencial de les xarxes en sociolingüística: la Franja 6 febrer 06UTC 2017

Posted by xarxes in estadística, Franja, sociolingüística, sociologia.
add a comment

El potencial de les xarxes en sociolingüística: la Franja

Dijous, 23 de febrer de 2017 a les 19:00. Sala Puig i Cadafalch de l’IEC. Carrer del Carme 47 de Barcelona

Natxo Sorolla
CUSC-UB, URV, UAB, Xarxa CRUSCAT-IEC
Durant els anys 80 i 90 s’explorà el potencial que l’anàlisi de xarxes socials tenia en sociolingüística (Gal, Milroy, Li Wei). Aflorà l’evidència que els atributs dels individus (sociodemogràfics, competències o actituds) no són suficients per a entendre les tries lingüístiques. Si la comunicació és bàsicament interacció social, per entendre-la no només cal estudiar l’emissor, sino també el receptor. Així, les xarxes funcionen com a plataforma sobre la qual flueixen les llengües. Quan la xarxa és densa, la cohesió social permet mantenir els vernacles enfront de les llengües i varietats difoses pels Estats-nació. Amb tot, el fort desenvolupament metodològic que l’anàlisi de xarxes ha tingut en les ciències socials no s’ha difós en la recerca sociolingüística.
En la nostra recerca, amb 245 alumnes de diferents poblacions de la Franja (Sorolla, 2016), ens hem servit d’esta metodologia per millorar la descripció dels rols sociolingüístics que desenvolupen els parlants, dibuixant amb major precisió els límits etnolingüístics. Això ens ha permès detectar un punt d’inflexió en l’hegemonia del català a la Franja, i l’emergència d’un procés de substitució lingüística. Acompanyarem esta exposició amb una reflexió sobre el potencial metodològic de l’anàlisi de xarxes socials en sociolingüística, especialment en els nous àmbits oberts en la societat informacional, o la societat xarxa.

El recompte de parlants d’aragonès (Spanien für deutsche – Das Aragonesische 1 febrer 01UTC 2017

Posted by xarxes in estadística, sociolingüística.
Tags: ,
2 comments

capturaHaig tingut una alegria en veure que a la web Spanien für deutsche fan una revisió sobre l’aragonès (L’Aragonés – Das Aragonesische, traducció automàtica al català) i en l’apartat demolingüístic citen el recompte que vaig fer a partir de l’enquesta que l’equip de l’Euskobarómetro va fer per al Govern d’Aragó, cap a l’any 2001. La xifra a partir d’aquelles dades situa els parlants adults d’aragonès de l’Alt Aragó al voltant dels ~25.000, dels quals 13.000 en són parlants inicials.

Les dades del Cens de 2011 (més informació), q
ue hem treballat amb el Seminari Aragonès de Sociolingüística, apunten a una xifra de 22.556 parlants d’aragonès a tot Aragó, de totes les edats. Els resultats de les preguntes sociolingüístiques als censos sempre donen valors més baixos que els resultats de les enquestes, i em temo que les enquestes són més fiables que no pas els censos. En tot cas, cadascuna analitza universos diferents, i l’aborda amb metodologies distintes.

Dir, fer, i l’efecte Netflix (Viles i gents) 13 gener 13UTC 2017

Posted by xarxes in ciència, estadística.
1 comment so far

Publicat a La Comarca, el 12/1/2016

Natxo Sorolla

En estos temps convulsos de Trump, l’emergència de l’extremadreta europea, la redefinició de l’esquerra al sud d’Europa o el sobiranisme a Catalunya, les enquestes i el mètode tradicional de la ciència social ha fallat estrepitosament, tal com revisàvem fa unes setmanes. Diuen que els únics que van pronosticar la victòria de Trump van ser els de les big data. Sigue casualitat, o no, la ciència social que analitze grans volums d’informació produïda a Internet està donant los seus primers resultats.

A partir del que la gent escriu a Twitter, del que comente a Facebook, o de les notícies que tenen més èxit a les diferents plataformes, se pot saber si estan feliços, què els cabrege, la seua edat, i fins i tot la seua filiació política. Ara ja no ham de demanar a la gent que declaro a una enquesta sobre les seues opinions i comportaments. Ara podem observar què fan realment. I hi ha qui ja ha posat nom comercial a este etern debat entre dades declarades i dades observades: l’efecte Netflix.

La plataforma en línia de sèries i pel·lícules mos pregunte, en escomençar, quines pel·lis mos agraden. I com mos pensem molt il·lustres, li diem que mos encante Woody Allen. Però si acte seguit lo que acabem fent és mirar tota la saga de Torrente, perquè estem cansats, Netflix pren nota. I enlloc de prendre com a patró allò que ham declarat que mirem (dir), mos anirà recomanant altres pel·lis relacionades en allò que ell observe que realment mirem (fer).

Aixina, per fi tenim capacitat de tindre un gran volum de dades observades gràcies al nostre comportament a Internet. De veure què diu la gent, què escriu, a on va o en qui ho fa. Evidentment, seguint les directrius ètiques i l’anàlisi no individualitzat. Però els més optimistes pronostiquen que en un futur seran los propis logaritmes que votaran per natres, que mos coneixeran prou a fons per a saber quin serà el nostre comportament. En tot cas, que no ho veiguen los nostres ulls! I que els humans continuem sent humans.

Instruccions per a importar enquestes del CIS, del CEO, i l’Encuesta de Condiciones de Vida (ECV) a PSPP 12 Desembre 12UTC 2016

Posted by xarxes in estadística.
Tags: , , ,
1 comment so far

En relació a la docència de tècniques quantitatives i un projecte, m’ha tocat treballar amb l’Encuesta de Condiciones de Vida d’Espanya, de l’INE, i amb la matriu de lliure accés. Cal no confondre-la amb l’Enquesta de Condicions de Vida i Hàbits de la Població de Catalunya, que no és de lliure accés (mal!). Per a la docència hi ha dues qüestions molt útils:

  1. El PSPP (baixar), que és un programa estadístic de codi lliure i similar a l’SPSS, però gratuït, i més que suficient per a la iniciació a l’anàlisi quantitativa. Hi ha qui ho ha provat amb altres opcions de codi lliure que faciliten la introducció a R, tals com Deducer, però comenten que no és fàcil per als primers nivells.
  2. Les matrius de dades d’accés lliure. En tenim diverses al CEO català (ja en format .sav), el CIS espanyol (unes instruccions mínimes com les que apareixen al final d’este apunt serveixen per a importar fàcilment la matriu a PSPP o SPSS mitjançant la sintaxi) o l’Encuesta de Condiciones de Vida de l’INE, que no és fàcil d’importar, i per això us comparteixo unes instruccions:

Instruccions per a importar enquestes del CEO

  1. Les instruccions per a importar-se els fitxer del Centre d’Estudis d’Opinió de la Generalitat de Catalunya realment no són instruccions, perquè les dades són accessibles em format .sav, i per tant, es poden llegir dirèctament des del PSPP i l’SPSS.

Instruccions per a importar enquestes del CIS

  1. Anar a la web d’anàlisi del CIS, on podrem buscar entre multitud d’enquestes (pestanya Estudios, i Búsqueda por texto libre, o per Preguntas). Seleccionar aquelles que ens donen accés a la matriu Fichero_datos (porten el símbol groc de fitxer comprimit en zip). Ens demanarà la nostra identitat i per a què volem l’estudi. Ho omplim, acceptem els termes, i ens el baixem.
  2. Descarregar el fitxer .zip i descomprimir-lo en una carpeta. Ens apareixen dos fitxers amb el número de l’estudi i sense extensió, precedits per DA el fitxer amb les dades, i ES el fitxer de la sintaxi.
  3. A este fitxer de sintaxi li posem l’extensió .sps, que és vàlida tant per a PSPP com per a SPSS. Obrim la sintaxi amb el PSPP. Podem provar si funciona sense fer-hi cap canvi, clicant a Executar All. Si funciona, ja teniu la matriu amb les dades i les etiquestes de variables i categories. Reviseu si està ben ponderada.
  4. Si ens  dona errors, és perquè no sap on té el fitxer de dades (DAxxxx). La primera fila de sintaxi li explica mitjançant un missatge de l’estil DATA LIST FILE= ‘DA3158’ Hem de posar-li l’adreça sencera al nostre disc dur del fitxer DA. En el nostre cas serà DATA LIST FILE= ‘C:\Users\qwerty\Desktop\MD3158\DA3158’ Una vegada ho hem canviat, tornem a donar-li a Executar i All.

Instruccions per a importar l’Encuesta de Condiciones de Vida (ECV) a PSPP

  1. Anar a la web de l’Encuesta de Condiciones de Vida:
  2. Clicar a la pestanya Resultados (esquerra). Clicar a la pestanya Microdatos (dalt).
  3. Seleccionar i baixar les dades transversals (Base 2013) de l’últim any (2015) i clicar a ir. Baixar-les a la carpeta en què treballarem. De la pantalla anterior baixar també el qüestionari i la metodologia general, per a poder consultar els continguts de l’enquesta.
  4. Les dades estan comprimides en zip (ecvb13_2015.zip). Si el nostre ordinador no reconeix aquests fitxer, clicar amb el botó dret al damunt del fitxer, i seleccionar amb quin programa ho volem descomprimir (per exemple, 7zip, o WinRar). Millor descomprimir-ho en una carpeta nova (ECV) dintre de l’escriptori, per exemple.
  5. Ens han aparegut dos fitxers nous: disreg_ecv15.doc i un altre de comprimit datos_ecv15.zip. Descomprimim també aquest nou fitxer. Ens apareixen 4 fitxers amb extensió .csv (valors separats per comes) amb el mateix nom, però amb una lletra diferent. Ens interessa el que porta la p (esudb15p.csv) perquè és l’enquesta completa a totes les persones. La resta són enquestes a llars, enquestes simplificades…
  6. Obrim PSPP, i cliquem a Arxiu>Import Data i seleccionem la carpeta on tenim el fitxer esudb15p.csv. El seleccionem i li donem a següent. Si sou afortunats, veureu els menús del PSPP per a importar. Si no sou afortunats, heu de fiar-vos que tot el que fa per a importar el fitxer per defecte és correcte, i en principi clicant a següent>següent>següent>aplica us ho importarà. De primeres tindreu una pantalla blanca durant minuts (poden ser més de deu, perquè està fent el procés i és una enquesta molt gran… tindreu el rellotge de windows que us marcarà que està pensant…). Podeu aprofitar a anar a fer un cafè i emportar-vos la bona notícia que s’ha importat quan torneu, clicant a la pantalla de [DataSet1] (en principi esteu a la pantalla d’Objectiu, i heu de canviar). Si triga més d’una hora podeu deixar de fer cafès perquè clarament no ho està fent bé.
  7. Una vegada s’ha importat, teniu 27.215 enquestes i 225 variables. La primera fila són els noms de les variables. Podeu aprofitar per a copiar-la a l’Excel, tornar-la a copiar, enganxar-la transposada, i copiar-la i enganxar-la als noms de variables de la vista de variables de PSPP, per a saber quina variable és cadascuna.
  8. El procés següent serà localitzar les preguntes que ens interessen (només) i posar-los el nom i les etiquetes de resposta per a poder-les analitzar.

Natxo Sorolla

natxo.sorolla@urv.cat

%d bloggers like this: