El rol del Data Scientist

El Data Science o la Ciència de les Dades, moltes vegades confosa amb el concepte de Big Data, és una evolució de la tradicional anàlisi de dades. Amb l’avanç de les noves tecnologies i la irrupció de la quarta revolució industrial, les tècniques que abans ens servien per analitzar i extreure informació de les dades, han quedat obsoletes. Això ha passat bàsicament per dues raons:

  • En primer lloc, perquè han aparegut mètodes d’anàlisi molt més potents i precisos.
  • I en segon lloc, perquè la quantitat i la qualitat de les dades de què disposem han crescut tan exponencialment que els antics mètodes ja no són ni tan precisos ni tan eficients en molts casos.

La figura del Data Scientist

Així doncs, es requereix una figura que sigui la pertinent (r)evolució del típic analista de dades. Una figura capaç d’entendre les noves tecnologies i les noves metodologies d’anàlisi, capaç de reinventar-se i continuar aprenent a gran velocitat i, sobretot, capaç de traduir-ho tot a un llenguatge “apte per a tots els públics”. Posant tots aquests requisits en una coctelera i sacsejant-la sorgeix la figura del Data Scientist, l’evolució de l’analista de dades tradicional que estàvem buscant.

Com treballa un Data Scientist i quina és la seva metodologia?

Hi ha diverses metodologies de treball, i com que la majoria tenen els mateixos punts clau, el següent gràfic és molt il·lustratiu del que és el cicle de vida d’un projecte dut a terme per un Data Scientist.

  1. Es comença amb la comprensió del problema de negoci, típicament mantenint reunions amb els usuaris finals del projecte i actualitzant-se amb la literatura disponible i exemples prèviament efectuats en aquest camp.
  2. Tot seguit cal entendre quines dades es tenen, on i com se’n pot disposar i l’accessibilitat a aquestes dades.
  3. En el següent pas es netegen i preparen les dades.
  4. Un cop tenim el conjunt de dades net i “sa”, es comença el procés de modelització*.
  5. Amb els resultats dels models passem a l’avaluació dels resultats**.
  6. Finalment, els projectes solen acabar amb el desplegament dels models, industrialitzant-los o incorporant-los en el sistema informàtic del client.

Vols saber més sobre Data Science?

Per a tots aquells interessats a saber una miqueta més sobre Data Science us deixem algunes lectures recomanades:

  • Extens article sobre què és Data Science, qui és un Data Scientist i algun altre concepte bàsic d’aquest “món”: Fes click aquí
  • Article sobre les diferències entre un estadístic i un Data Scientist: Fes click aquí
  • Interessant web d’entrevistes en format podcast a diferents Data Scientists: Fes click aquí

Ha ocurrido un error, intentalo de nuevo
Pregunta a nuestros expertos

Tus comentarios serán publicados una vez sean validados por nuestro equipo