Es mostren els missatges amb l'etiqueta de comentaris Softcatalà. Mostrar tots els missatges
Es mostren els missatges amb l'etiqueta de comentaris Softcatalà. Mostrar tots els missatges

dijous, 16 de gener del 2025

Cinc anys de la «Paremiologia catalana comparada digital (PCCD)» 2020-2025


 L'altre dia discutíem amb Pere Orga, l'amic informàtic de Softcatalà que ha fet el desenvolupament de la Paremiologia catalana comparada digital (PCCD), si ja era el cinquè aniversari de l'eina. La veritat és que es fa difícil de determinar, perquè va estar en període de proves durant força mesos abans d'obrir-la al públic en general i vam decidir fer-ne difusió un dia determinat, el dijous, 16 de gener de 2020, per anunciar que fèiem la presentació a Vilaweb el dimecres, 29 de gener. 

Pere Orga ha fet un escrit al seu blog per aquesta efemèride i repassa molt bé els antecedents (que es remunten al juliol de 2017).

Per tant, la primera piulada també és d'aquest dia, tot i que anteriorment jo ja havia fet anar algunes captures de pantalla de resultats del cercador de parèmies.

Sigui com sigui, i aprofitant que diumenge vam fer l'actualització d'aquest mes de gener, podem dir que som en el cinquè aniversari i potser fora bo poder-ne fer una mica de valoració.

Primer de tot, les xifres, que parlen soles.

Vam obrir l'eina amb 150.000 registres corresponents a uns 10.000 paremiotipus diferents i, ara com ara, ja hi ha més de 780.000 registres agrupats en 85.000 paremiotipus diferents. Per tant, en cinc anys hem multiplicat el contingut per cinc. Si fem un balanç global podem dir que la mitjana de visites durant aquests cinc anys pot estar en el miler de visites diàries, que ens acosta a les 100.000 pàgines mostrades cada mes.


També cal tenir en compte que gairebé 120.000 registres contenen informació equivalent en altres llengües, per a poder aplicar la paremiologia comparada. Sobretot, castellà (més de 60.000), llatí (més de 20.000), francès (gairebé 20.000), italià (més de 10.000), gallec (vora 2.000), anglès (uns 1.500) i, amb presència més modesta, també esperanto, portuguès, alemany, occità, provençal, basc, asturià, aragonès, sicilià, suec, cors, neerlandès, romanès, sard o polonès. Però no tot ha de passar pel sedàs numèric i hi ha altres valors afegits que voldria destacar, d'una manera més desordenada i emocional.

Un cop més recordo que el nom és deutor (i fa homenatge) a la Paremiologia catalana comparada (PCC) de Sebastià Farnès, publicada pòstumament per Columna Edicions entre el 1992 i el 1999, en vuit volums, de la mà de Jaume Vidal Alcover, Magí Sunyer i Josep Lluís Savall, amb la col·laboració de J. M. Pujol, a partir de les fitxes i materials recopilats en vida per l'autor. Ell havia publicat, el 1913, per fragments, a la revista "Il·lustració Catalana", un Assaig de Paremiologia Catalana comparada. Volum I (abarcar-amich). Sens dubte és l'obra cabdal de la paremiologia catalana, per qualitat i volum. Però, si tenim en compte que Sebastià Farnés va morir el 1934, queden fora d'aquest recull enciclopèdic el mateix DCVB, que va acabar-se de publicar el 1962, bona part de l'obra de Joan Amades, publicada sobretot a partir dels anys 30, i altres obres posteriors com els materials d'Enciclopèdia Catalana.

Per a una data tan assenyalada em feia il·lusió poder-hi mostrar els resultats d'un dels millors repertoris de fraseologia catalana: el Diccionari català-valencià-balear, d'Alcover-Moll. No era una prioritat, perquè aquesta obra està digitalitzada i es pot consultar des del portal de l'Institut d'Estudis Catalans des de fa molts anys, però era una mancança que quan es feia una cerca a la PCCD no hi apareguessin les recurrències d'aquest diccionari. I ara hi he posat remei, després de molts anys de feixuga feina per destriar les aportacions fraseològiques i de llenguatge figurat d'aquesta magna obra. Són 44.640 registres (que encara no he pogut incorporar completament) i que representen poc més d'un 5% del total del repositori. Per entendre'ns, la PCCD actualment pot ser l'equivalent a 20 DCVB.

I això és així perquè ja hi ha més de 750 obres buidades. De diferent magnitud i naturalesa. Des de gramàtiques, diccionaris i enciclopèdies a refranyers i monografies locals. Obres de literatura, articles d'investigació especialitzats, articles divulgatius de les xarxes, aportacions orals, apunts curts de xarxes socials... 

No hi ha només frases fetes, locucions i refranys, sinó que hi he volgut deixar mostra d'altres elements del llenguatge figurat català, com ara embarbussaments, palíndroms, onomatopeies, corrandes, dites tòpiques, respostes de rebot, retrucs, endevinalles, interjeccions, exclamacions, mimologismes, insults, renecs, paraulotes, llenguatge d'argot, argot juvenil... En definitiva, tot allò que ens connecta amb el giny i la creativitat de la llengua figurada.

Hi he treballat a partir de diversos eixos. Sé que és una feina inacabable i inabastable i he hagut de prioritzar quines obres abordava. I en aquesta tria hi ha tingut un pes decisiu l'antiguitat de l'obra, la inaccessibilitat de determinades fonts, donar llum a materials inèdits o cercar materials representatius de tot el domini lingüístic.

Així, per antiguitat, les obres més representatives són aquestes:

Les principals fonts inèdites incorporades (filtrar per MAN o AUT al fitxer d'Access) són aquestes. Es tracta tant de manuscrits com d'autoedicions. En total, una seixantena d'obres recuperades (o incorporades) a disposició de tothom, amb una importància desigual, però sempre valuosa:



I per àmbit territorial, hi ha 292 obres de Catalunya, 64 obres del País Valencià, 45 de les Illes Balears, 40 de la Catalunya del Nord, 11 de la Franja de Ponent o 2 de l'Alguer. A banda d'obres generals o infantils, no catalogades geogràficament.

També m'alegra poder comptar amb l'ajuda inestimable d'Albert Aragonès, que m'està ajudant a localitzar i buidar moltes obres de la zona de les Terres de l'Ebre (i del Matarranya, la Plana, el Maestrat o el Cinca, preferentment). És autor d'alguna obra paremiològica de l'àrea de Tortosa i bon coneixedor del folklore i la cultura tradicional. El compromís era d'ajudar-me a buidar el Refraner tortosí de Bayerri, de 4 volums, dels quals jo només he pogut buidar el primer volum, però abans han arribat més d'una vuitantena d'altres obres que han sumat més de 17.000 registres a la base de dades global.

I la intenció és continuar en aquesta línia. Ara he plantat la llavor i he construït una base sòlida de projecte que ha de seguir creixent de manera sostinguda i ordenada. Cal detectar necessitats i buits i encarar-ho per anar-ho completant en un futur. Jo sempre he entès que ha de ser una obra que em pervisqui i en les pròximes dècades la meva intenció és garantir-ne la continuïtat cercant col·laboradors que vulguin donar un cop de mà i continuar aquesta obra, acompanyant-me en aquest camí que vaig iniciar fa més de trenta anys.


diumenge, 16 de febrer del 2020

Crònica de la presentació de la Paremiologia catalana comparada digital (PCCD) a l'Espai Vilaweb

Fotografia de Lluc Pàmies Milian
El passat dimecres, 29 de gener de 2020, a les 19.00 h, va tenir lloc la presentació davant d’una cinquantena de persones de la Paremiologia catalana comparada digital (PCCD) a l’Espai Vilaweb. Jordi Badia, cap d’estil de VilaWeb va exercir d’amfitrió per obrir i tancar l’acte i van parlar també Pere Orga, informàtic de Softcatalà i Víctor Pàmies, lingüista especialitzat en paremiologia.

Podeu veure el vídeo de l’acte sencer en aquest enllaç.

La Paremiologia catalana comparada digital (PCCD) és una eina en línia, desenvolupada per Pere Orga, informàtic de Softcatalà, que dona accés obert a la consulta del banc de dades fraseològic de Víctor Pàmies, gestor i mantenidor del fons paremiològic. En aquests moments ja es poden consultar 160.000 fitxes corresponents a més de 10.000 unitats fraseològiques (al programa li diuen paremiotipus) diferents, després de la darrera actualització. L’entorn és responsiu i s’hi pot accedir des de qualsevol dispositiu connectat a internet (mòbil, tauleta o PC).

El programa s’allotja als servidors de Softcatalà, i es presenta sota una llicència Creative Commons Atribució-NoComercial-CompartirIgual 4.0 Internacional i es redirigeix a un subdomini del web sobre paremiologia catalana de Víctor Pàmies.

Durant l’acte de presentació es van poder mostrar les funcionalitats del programa informàtic, molt còmode i ràpid de consultar des del mòbil, quines opcions de cerca i en quins camps es pot filtrar la informació i quin tipus de fonts s’hi poden trobar documentades. Bàsicament és un recull de fonts orals, en paper i digitals.

Fotografia de Lluc Pàmies Milian
Víctor Pàmies va explicar que, com que és una feina inacabable i inabastable, ha hagut de prioritzar quines fonts hi incorporava. Així, hi ha anat abocant els primers repertoris coneguts amb fraseologia catalana, obres antigues, desconegudes i poc accessibles al públic en general i també aquelles obres que per la seva singularitat aporten detalls de qualitat al recull, ja sigui perquè són reculls d’un àrea local molt restringida i delimitada (parlars concrets com ara de l’Empordà, dels Pallars, de la Catalunya del Nord), ja sigui perquè permeten oferir un ventall dialectològic polièdric, amb buidatge d’obres de les Illes, de l’Alguer, del País Valencià, de les comarques de Lleida, etc. Per tant, aspira a la màxima compleció possible, però tenint sempre en compte que és preferible la qualitat que la quantitat.

Al final de l’acte, hi va haver temps perquè els assistents poguessin formular aquelles preguntes que els van semblar oportunes de fer, com per exemple preguntar si hi havia alguna eina semblant (en obert) en altres llengües, si es podia fer algun tipus de filtre “parental” per fer més menjívola la informació a infants o nous parlants de la llengua, també per destacar que tota aquesta informació estigui disponible en obert i a l’accés de qualsevol que la vulgui fer servir...

Fotografia de Lluc Pàmies Milian
Víctor Pàmies i Pere Orga van agrair l’assistència de totes les persones que es van desplaçar fins a VilaWeb per fer-los costat en la presentació i van aprofitar per anunciar que volen treballar en el desenvolupament d’una altra eina, més encarada a traductors, que permeti consultar equivalents idiomàtics de les parèmies catalanes.

Sobre les millores de la Paremiologia catalana comparada digital, a banda de seguir incorporant noves fonts, es vol fer una classificació temàtica de les parèmies recollides, i també oferir la possibilitat de consultar-les a través de les festivitats del calendari, un mapa de toponímia o els mots claus de cada unitat fraseològica.