Obra Cultural Balear

L’OCB col·labora en el projecte ‘Parla’m’ per ensenyar les noves tecnologies a entendre i parlar català

L’Obra Cultural Balear col·labora en el projecte ‘Parla’m’, un projecte impulsat per Òmnium Cultural per aconseguir que les tecnologies del món 4.0 es comuniquin amb l’usuari en català. La campanya té l’objectiu de recollir textos escrits i orals que ajudin a generar models de llengua per ensenyar les noves tecnologies a entendre i parlar català. L’OCB hi col·laborarà cedint els textos i veus de l’entitat.

Les empreses tecnològiques utilitzen grans bancs de veus i textos per entrenar les tecnologies i incorporar cada llengua a Alexa, Siri, Google o a les intel·ligències artificials. Per aconseguir que el català també hi estigui disponible, és imprescindible construir un gran banc de textos i veus en català amb l’objectiu de fer possible la presència de la llengua catalana en el terreny digital i de la intel·ligència artificial.

A través del projecte ‘Parla’m es fa una recollida de textos i àudios que es comparteixen anonimitzats amb el Barcelona Supercomputing Center, entitat col·laboradora del projecte Aina, que els processen per entrenar reconeixedors i sintetitzadors de la parla i per crear models de llenguatge en català que es distribuiran entre les empreses tecnològiques de forma lliure.

Les aportacions de veus o textos poden ser tant de persones individuals, des del mòbil o l’ordinador a través del web del projecte Parlam: parlam.omnium.cat, com de mitjans de comunicació, entitats, ràdios, revistes, blogs, editorials, autors/es, streamers, pòdcasts o universitats. Així, els textos o àudios han d’haver estat obtinguts i transmesos de forma lícita i l’entitat que els aporta ha de tenir ple dret jurídic per a lliurar-los al Barcelona Supercomputing Center. Els textos poden ser: notícies, pòdcasts, streams en català, programes de ràdio, tertúlies, articles d’opinió, documents oficials, textos infantils, obres literàries, treballs de fi de grau, tesis doctorals, poemes, etc.

Se signarà un acord amb Òmnium i el BSC tractarà prèviament els àudios i textos aportats, per excloure dades personals, triar els fragments útils per generar models del llenguatge en català, com també per eliminar qualsevol informació personal. El text o àudio original aportat mai serà publicat pel BSC ni per Òmnium, ni es podrà reconstruir a partir dels fragments utilitzats, impedint qualsevol ús indegut d’aquests. Òmnium i el BSC agrairan públicament l’aportació de l’entitat i a finals d’octubre es farà un gran acte d’entrega dels textos i àudios al BSC pel projecte Aina.