jump to navigation

Anàlisi de les llengües a la Wikipedia, demà a la Viquitrobada 2009 2 Octubre 02UTC 2009

Posted by xarxes in estadística, sociolingüística, sociologia.
Tags: , , , , , , , , , , ,
1 comment so far

Demà presentem a la trobada de Wikipedistes en català (Viquitrobada 2009) els primers resultats sobre la relació entre les variables socials i el desenvolupament de les llengües a la Wikipedia (abstract inicial). Volem trobar les raons per les que el xinès té a dia d’avui 274.271 articles (posició 12) i el català 201.945 (posició 15) (estadístiques). A ningú escapa la situació diferent del xinès i la del català. El primer té pràcticament 1.000 milions de parlants i el segon poc més de 9 milions. El primer es desenvolupa en una comunitat lingüística de contrastos socioeconòmics i el segon en una comunitat lingüística sòlidament assentada en la societat de la informació. El primer és oficial a una potència mundial i el segon només és cooficial en alguns territoris. I amb tot, tenen un número similar d’articles a la Wikipedia. Intentarem buscar resposta a la pregunta. I sobretot… ens trobarem moltíssimes preguntes més per a respondre.

Els factors que expliquen el desenvolupament de la Wikipedia en algunes llengües 27 Agost 27UTC 2009

Posted by xarxes in xarxes.
Tags: , , , , , ,
6 comments

A una entrevista que ahir feen al creador de la Wikipedia a La Voz de Galicia atacava de ple a una recerca que estem portant a terme per a explicar per què algunes llengües tenen una presència molt important a la Wikipedia i altres no.

-El español es el cuarto idioma más hablado del mundo, pero la Wikipedia en español es solo la octava más completa. ¿Cómo ve esa incongruencia?

-La Wikipedia en español empezó más tarde que en los otros idiomas. Al principio, hubo una pelea grande y la mitad de las personas desistieron. Llevó un tiempo hasta que se recuperó. Pero en general los países más nórdicos tienen más éxito, porque también tienen más acceso a banda ancha y las tasas de alfabetización son más altas. Pero también digo en broma que en países donde el clima es más agradable las personas salen de casa para hacer otras cosas.

Un dels temes que tracten és lo pes demogràfic de la llengua: lo nombre de parlants. I Wales hi suma dos factors més: l’accés a Internet i les taxes d’alfabetització. Les dades que nosaltres estem tractant no incorporen el clima, com indica en broma Wales, però afegim altres factors, com la capacitat econòmica o la desigualtat econòmica… Tot i això, la resposta de Wales no va molt desencaminada. Aviat presentarem los primers resultats.

Notes:

  • La Voz de Galicia no es preocupa per la posició 40 del gallec i la posició 9 del portuguès.
  • Lo castellà ha superta fa pocs dies los 500.000 articles. Felicitats per als wikipedistes en castellà!
  • La Viquipèdia en català està en els 194.926 articles, amb un fort creixement dels prop de 125.000 que tenia l’any passat, quan va copsar la posició número 15 en el rànquing . Preparem-nos per a celebrar els 200.000 articles durant el mes de setembre!

Síntesi de l’Estudi sociodemogràfic i lingüístic als centres d’educació secundària de Catalunya 8 Juny 08UTC 2009

Posted by xarxes in estadística, sociolingüística.
Tags: , , , , , , , , , ,
add a comment

Divendres passat, 5 de juny de 2009, es va presentar l’Estudi sociodemogràfic i lingüístic als centres d’educació secundària de Catalunya. Me’n vaig encarregar de presentar els resultats de l’estudi, que es poden resumir en 7 punts:

  1. Arrelament territorial de de la mostra: alumnes i pares
    Però…. diversitat en la llengua d’origen

    1. Creixement de les combinacions de català i castellà
    2. Tendència a la transmissió familiar dels castellanoparlants i els catalanoparlants
      Però… major transmissió dels catalanoparlants

      1. L’escola funciona en català
      2. I universalitza la competència de català i castellà
      3. El pati funciona en la llengua inicial de l’alumne
      4. El consum cultural en català es baix

      Baixeu-tos la presentació: Estudi sociolingüístic secundària

      Resultats de l’estudi

      A Aragó, los cristos i les marededéus tenen més valor que les llengües vives 16 Març 16UTC 2009

      Posted by xarxes in Franja.
      Tags: , , , , , ,
      4 comments

      Actualitzo diàriament Franja.tk, a on s’ha creat un repositori de l’actualitat sobre la Franja, el català, lo multilingüisme a Aragó, les relacions amb Catalunya i el País Valencià… Mos trobem en una etapa a on l’allau de notícies sobre els bens de la Franja m’ha fet decidir que no val la pena penjar cada notícia que es fa. I abans haig hagut de rebre canya per part dels lectors, pel temps que requeria llegir cada titular. Si costa llegir-ho, imagineu el què és penjar les notícies! Però això no és res, perquè la majoria les rebo ja triades. Imagineu què és haver-ho de seleccionar com ho seleccionen els del Casal Jaume I de Fraga (als que aprofito per a agrair-los la faena que fan!). Només amb un resum de titulars com el que haig fet avui, amb notícies eixides este capdesetmana, sumen 27 notícies.

      Si la premsa aragonesa (i lleidatana) mostraren una dècima part d’interès per la situació del català (i l’aragonès) com a patrimoni lingüístic d’ús habitual al territori, i en desenvoluparen un argumentari de defensa tan travat com lo dels bens de la Franja, segur que hauríem de patir menys pel futur del català i l’aragonès. La premsa aragonesa no posa en dubte que els bens de la Franja “han de tornar a Aragó”. Però no posen lo dit a la llaga preguntant si els bens de la Franja tornaran a les seues viles, o novament es trobaran a l’exili, a Barbastre. De capital a capital, que per a alguna cosa els bens són “nostres”.

      Tot sigue perquè d’aquí 100 anys es puga fer un Museu d’interpretació de la llengua aragonesa amb panells explicatius i vídeos d’allò que parlaven lo segle passat, i unes Jornades d’exaltació de les darreres dones de la faldeta que (encara) parlen català, amb parlaments públics de les dones que encara van aprendre el català a casa. Lo patrimoni històric sempre desperta més passions que el que està viu. Sobretot si serveix per a polemitzar amb Catalunya.

      PS: Perdoneu la simplesa dels arguments, però Mals temps aquells en què és necessari explicar allò evident

      Imatge de 21rs

      Sabíeu que la tercera Wikipedia en obrir-se va ser la de llengua catalana? 17 Març 17UTC 2008

      Posted by xarxes in sociolingüística.
      Tags: , , , , , ,
      2 comments

      Tot bé a compte de què ahir va fer 7 anys que es va obrir la Wikipedia en català! I a la vegada, ahir, i sense ser-ne conscients (i en diumenge i també dissabte fins a altes hores!), vam estar tancant una proposta de comunicació de la Moonydoodle sobre les llengües a la Wikipedia. I redactant i buscant informació em vaig quedar molt sorprés que el català va ser la tercera llengua de la Wikipedia: primer l’anglès, i als pocs mesos s’obria al multilingüisme amb l’alemany i el català. Així que ahir vaig llegir la data de creació de la Viquipèdia en català, però no vaig caure que era l’aniversari. Avui veig a L’home dibuixat  que celebrem el setè aniversari. I aportava informació més interessant: les persones clau d’aquella edició catalana primerenca  i la primera portada.
      Però continuem en lo nostre projecte, per a estudiar els factors que situen una llengua amb més o menys articles a la Wikipedia. Tot neix d’un apunt de la Moonydoodle al seu bloc, lamentant-se que de vegades es queda badant davant l’ordinador, però no bada, és que pensa. I reflexionava de quins factors fan que una llengua tinga més o menys articles a la Wikipedia. Per exemple, l’edició en català se situa en les primeres posicions d’entre les 250 i més llengües que compten amb Wikipedia. Un estat de normalitat excepcional en comparació amb la situació de la llengua en altres àmbits. Al moment de llegir lo seu apunt, vaig començar a veure en somnis la matriu de dades posada al SPSS amb el nombre d’articles de la Wikipedia, editors, nombre de parlants, ordinadors per cada 1000 habitants i tantes altres dades. Anàlisi factorial, anàlisi de conglomerats… I em vaig oferir a fer de màquina per al projecte, si ella coordinava el treball i feia la part interpretativa. Hem començat a treballar i també hem acabat formant equip amb aquell que pensa que la vida s’ha de prendre Amb certa calma, que incorporarà tota la part teòrica que ens faltava. Si hi sumem que el projecte ha nascut entre el Matarranya, la vila de Gràcia i Amsterdam, mitjançant gTalk i Google Docs, la blocòsfera, la web 2.0 i la vida mòbil en general m’està deixant una mica fora de lloc.
      Les anàlisi preliminars que haig fet fins ara, amb les edicions de la Wikipedia amb més de 100.000 articles, ja apunten coses molt interessants. El principal factor de diferenciació entre edicions és la quantitat d’articles, i no només això, si no també de persones que l’editen. Algunes compten amb moltíssims articles editats per poques persones. El segon, seria el nombre d’articles de la Wikipedia per cada parlant d’esta llengua. Algunes grans llengües amb pocs articles tenen ratis extremadament reduïts, com és el cas del xinès. I en tercer lloc quedaria el factor que es mostra més interessant: l’estrès de cada edició de la Wikipedia. Algunes Wikipedies compten amb un rati molt alt d’usuaris per parlant, possiblement per trobar-se en un estat avançat de difusió de les noves tecnologies i la seua integració dins la cultura popular. Però altres compten amb pocs usuaris que editen molts articles. I aquí hi ha segurament l’èxit del català. Si el comparem amb altres llengües de demografia mitjana, veiem que el noruec i el finlandès compten amb més de 14 editors de la Wikipedia per cada 1000 parlants. El català només té 2 editors per cada 1000 parlants. Però aquests darrers editen 9 articles per cap, i els nòrdics només arriben a 2. En parlarem amb més profunditat més endavant. De moment, anys i anys, per molts anys!