EMPRENEM
Balears 17/06/2017

Ciència de dades, el negoci que pensa per nosaltres

Pythia és la primera consultora mallorquina especialitzada en l’assessorament sobre implantació d’algoritmes d’intel·ligència artificial i models informàtics més potents, àgils i eficaços

i
Enric Culat
5 min

Suposem que som a la web d’un portal immobiliari i volem posar el preu de venda d’una casa a l’hora de publicar un nou anunci. En aquest cas, la solució més convencional seria establir un codi que consulti la base de dades i assigni el preu mitjà de tots els anuncis semblants respecte d’aquest tipus de casa. La solució amb Machine Learning, en canvi, consistiria en un codi que consulti l’anterior base de dades però que, a més, dedueixi com influeixen les característiques específiques (tipus d’immoble, estat de conservació, metres quadrats, habitacions, nombre de plantes, banys, etc.) en el preu final mitjançant un mètode d’estadística clàssica de regressió lineal que guardi tots els coeficients. La diferència entre les dues solucions és que en la primera és el programador qui indica a la màquina en què ha de basar la seva decisió (fonamentalment, en el tipus d’immoble), mentre que en la segona deixa que sigui la màquina la que en dedueixi el preu, mitjançant un algoritme de càlcul de coeficients de regressió lineal, tenint en compte molts més elements.

Posar algoritmes d’intel·ligència artificial molt potents al servei d’una empresa i deixar que actuïn, ells mateixos, interpretant i prenent les decisions més encertades, i a una velocitat de milers de vegades per cada segon: en això consisteix el Machine Learning, que permet capturar el comportament de l’usuari a la web i, a partir d’aquí, extreure’n conclusions sobre el tipus d’accions que cal dur a terme. Això ja ho estan fent, pel seu compte, empreses com Amazon. Si entram a la seva web, després de tres o quatre clics la mateixa pàgina ja ens suggerirà que comprem determinats productes, que són els més probables que estiguem cercant, segons les característiques detectades per un algoritme que ha capturat i interpretat el nostre comportament. Machine Learning és un paradigma de programació en el qual no s’indica explícitament a l’ordinador com ha d’actuar en funció de les dades d’entrada, tal com es fa en la programació convencional, sinó que deixa que sigui ella mateixa, la màquina, la que ho dedueixi tot. Algunes empreses mallorquines ja tenen departaments de Machine Learning amb personal dedicat exclusivament a aquest tipus de tasques, com Habitissimo, Logitravel i Hotelbeds.

Pythia, en canvi, és una consultoria mallorquina dedicada exclusivament a la ciència de dades, que alhora inclou Big Data, Machine Learning, Data Mining, Natural Language Processing i altres conceptes que impliquen reptes tecnològics que a poc a poc estan canviant la manera més tradicional d’entendre un negoci per substituir-la per una “arquitectura del software” molt més moderna, però també més arriscada. Pythia està en marxa des del mes de novembre passat i la componen dos socis, Carles Sala i Manuel Álvarez, que es defineixen a si mateixos com a “científics de dades” especialitzats en la implantació de nous models informàtics molt més “racionals i eficaços”.

Però canviar els esquemes tradicionals no és senzill. La ciència de dades és una branca de l’enginyeria del software que necessita molta creativitat i un gran marge per poder dedicar temps a investigar. Això xoca amb l’actitud d’empreses consolidades o tradicionals que normalment no estan disposades a donar aquest marge d’exploració i prefereixen continuar aplicant models de negoci i sistemes de programació més convencionals. “No es tracta simplement d’introduir una tecnologia nova, sinó que per aprofitar aquesta tecnologia s’ha de canviar l’enfocament del negoci”, matisa Carles Sala, que argumenta que aquest tipus d’eines no només automatitzen certes tasques, també permeten encarar el negoci d’una altra manera. És a dir, per aprofitar al màxim el Machine Learning s’ha de replantejar l’estratègia de negoci, però sovint les empreses més consolidades són a les quals més costa arriscar-se en aquests canvis.

Fins ara, les empreses resolien els seus problemes a través de la programació convencional, però a Pythia estan convençuts que, de la mateixa manera que quan va aparèixer la informàtica, al principi hi havia molt poques empreses disposades a fer-la servir, amb la ciència de dades passarà una cosa semblant. Només és qüestió de temps i d’atrevir-se a canviar els esquemes. Els sectors més desenvolupats, com per exemple el turisme, són els que ja hi estan treballant, però al final arribarà a tots els sectors.

De moment, a Pythia han decidit anar pas a pas i començar pel principi, primer explicant el significat dels conceptes, ordenant-los com toca, i després assessorant les empreses, analitzant-ne els negocis per veure quines dades es poden generar, guardar i, sobretot, per què es poden utilitzar. En realitat, qualsevol negoci que tingui un mínim de volum informàtic acumula, intrínsecament, moltes dades que sovint es descarten, sense guardar-les ni tenir en compte que poden ser útils per a les empreses. Carles Sala i Manuel Álvarez ofereixen aquest assessorament de manera presencial, trobant-se amb els clients. Després en fan una anàlisi acurada que presenten a l’empresa com una proposta de “reaprofitament” de les seves dades. “Al principi les empreses no eren gaire conscients que necessitaven aquest servei, però no ens podem queixar, perquè les coses estan sortint, a poc a poc, també gràcies a xerrades i esdeveniments en els quals participam i on estam coneixent molta gent disposada a trencar els seus esquemes”, expliquen els dos socis de Pythia, que de formació són matemàtics i programadors. “Un científic de dades ha de ser una barreja de tot, amb un perfil de programador que sap més de matemàtiques i un matemàtic que sap més de programació”, diuen.

Els dos en posen més exemples per poder entendre els avantatges del Machine Learning i que tenen a veure amb classificacions de text i identificació automàtica de missatges per tal de donar-los una utilitat pràctica. El que les persones diuen a les xarxes socials, el que escriuen els usuaris al Twitter, serveix per fer prospeccions de mercat i extreure’n la seva opinió, favorable o desfavorable, respecte de determinades qüestions, productes i serveis. Així, conjuntament amb una important empresa cervesera belga, Pythia ha desenvolupat un projecte de seguiment al Twitter, a determinades pàgines web i blogs, per tal d’extreure’n informació a través de tècniques de “processament de llenguatge natural” i, en conseqüència, saber què és el que la gent opina sobre tot un llistat de paraules clau vinculades a la cervesa: sabors, ingredients, graduació, marques, etc. Amb els resultats a la mà, el projecte ha permès fer una radiografia de mercat que alhora ha servit per respondre les preguntes de com hauria de ser i quines característiques hauria de tenir una cervesa de nova implantació en un lloc determinat.

Pel que fa a altres projectes concrets de Pythia, ara mateix la consultora treballa en disciplines diverses com gestoria, xarxes socials, qüestions legals, turisme online i webs de reserves amb sistemes informatitzats. “Sortosament tenim un poc de tot”, explica Carles Sala, que detalla que estan tractant d’arribar a un acord amb el grup Hotelbeds i veure com poden enfocar un projecte molt innovador. Explica que també col·laboren amb Txerpa, una gestoria en línia per a autònoms vinculada a Gil Estarellas; “per cert, una empresa on tenen molt ben enfocada tota la qüestió del Big Data”, n’opina. Amb Mallorca Wifi, una empresa que proveeix infraestructures de xarxes wifi, han previst treballar temes de dades wifi i localització, mentre que amb la consultora Términos y Condiciones exploren temes jurídics i legals sobre identificació de clàusules abusives en els contractes, o un robot que sigui capaç d’utilitzar Twitter per identificar gent que vulgui un advocat o assessorament jurídic, cercant determinades paraules i frases a Twitter per detectar necessitats i, a partir d’aquí, dissenyar un sistema que permet filar encara més prim estudiant el tipus d’usuari, seguidors, etc. Carles Sala i Manuel Álvarez estan convençuts que, amb vista al futur, els sistemes de ciència de dades aniran a més “i, per tant, estam segurs que haurem de contractar gent a la nostra empresa i deixar de treballar en sistema remot per ubicar-nos en un espai físic”, conclouen els dos socis de Pythia. Més info, a https://www.pythiac.com/es/.

stats