Una gravadora de veu digital i un bolígraf asseguts a sobre d’un bloc de notes.

La transcripció va ser una vegada un procés manual i tediós. Els metges, periodistes i una àmplia gamma de professionals assenyalarien les seves notes i converses en una cinta de dictàfon esgarrifós i, després, s’asseuren davant dels ordinadors per escriure-les.

Endavant el 2020 i hi ha diversos serveis que podeu utilitzar per convertir una gravació d’àudio en text a la pantalla d’un ordinador. Tot i això, queda una pregunta: són segurs? Al cap i a la fi, podeu carregar enregistraments de veu de converses delicades i correus electrònics privats.

Mirem aquests serveis i com podeu protegir la vostra informació.

Com funcionen els serveis de transcripció d’àudio

Els serveis de transcripció d’àudio solen caure en tres camps. El primer es basa completament en ordinador i utilitza models de IA i d’aprenentatge automàtic existents per processar la conversa. El segon és el més car perquè la gent realitza un fort aixecament. El tercer és una combinació de processament informàtic i humans.

Les probabilitats probablement conegueu la primera categoria. Els serveis de transcripció de veu, com els que ofereixen Google, Apple i Otter.ai, converteixen les ones analògiques que crea la vostra veu en una representació digital. A continuació, els divideix en petits segments (de vegades, a la mil·lèsima de segon) i els relaciona amb "fonemes" o elements d'una llengua.

Aquests algoritmes tracten d'examinar-los en el context d'altres fonemes i posar-los a través de models estadístics i d'AI que, finalment, produeixen text. Com que aquests serveis de transcripció són totalment informàtics, solen ser els més barats a executar. Tanmateix, la precisió no sempre és puntual, sobretot quan es tracta d'extreure text de entorns sorollosos o multipersones.

La transcripció alimentada per humans implica plataformes dedicades, com Rev, que connecten clients amb un conjunt de transcriptors aprovats prèviament. També podeu contractar algú d’un mercat independent, com Upwork o Fiverr, per transcriure-us.

Finalment, hi ha la barreja dels dos. Per agilitar el procés de transcripció, alguns llocs permeten a AI fer els treballs previs, i després algú ordena la sortida i soluciona els errors.

Els serveis de transcripció es comporten malament

Un dit que toca un altaveu d'Amazon Echo.

En els darrers anys, molts serveis de transcripció han estat objecte d'infraccions i escàndols.

Potser el més antic (i, possiblement, el més impactant) va ser SpinVox, que als anys '00 oferia un servei que convertia els missatges de veu en missatges SMS. En aquell moment, es considerava res més que un avenç tecnològic. La signatura va atraure ràpidament premsa positiva, clients i grans fosses de finançament.

El problema? Desconeguts dels clients, els seus missatges de veu van ser processats per persones que treballaven des d'oficines a llocs com Pakistan, Maurici i Sud-àfrica. Una persona privilegiada de la companyia va afirmar que només el 2 per cent dels correus electrònics eren processats per màquina i la resta eren gestionats per prop de 10.000 treballadors explotats.

Quan els empleats d'una oficina de SpinVox pakistanesa no cobraven, van començar a enviar missatges directament als clients per protestar. Al final, la veritat va sortir i SpinVox va perdre gran part del seu valor. En última instància, les restes de l'empresa van ser venudes a Nuance, un dels majors proveïdors de reconeixement de veu del món.

Més recentment, el periodista de ciberseguretat, Brian Krebs, va descobrir una infracció important que es va produir a MEDantex, un proveïdor de serveis de transcripció de veu basada en Kansas per a professionals mèdics. Previsiblement, es van filtrar dades (algunes de les quals dataven del 2007) que contenien registres mèdics sensibles. El contingut es podia descarregar d'un portal insegur com a fitxers de Microsoft Word.

Fins i tot els serveis de transcripció digital no són segurs. Al cap i a la fi, quan utilitzeu un servei totalment pilotat per ordinador, l'empresa podria utilitzar contractistes humans per realitzar el control de qualitat.

El 2019, el lloc de notícies belga, VRT NWS, va descobrir que els contractistes de Google escoltaven converses entre els individus i els seus assistents intel·ligents de Google Home. Un contractista fins i tot va proporcionar a VRT NWS accés a converses, moltes de les quals eren de caràcter profundament sensible (i, en alguns casos, íntimament sexual).

Amazon, Apple i Microsoft també utilitzaven contractistes d'aquesta manera. És a dir, algú escolta enregistraments de veu del vostre assistent virtual.

RELACIONATS: Com evitar que les empreses escoltin els vostres enregistraments assistents de veu

Els serveis de transcripció en línia són segurs?

Una dona que portava auriculars i escrivint un ordinador portàtil.

El problema més important és si els serveis de transcripció en línia són segurs. Malauradament, la resposta és una mica complicada.

L’espai de transcripció de la veu és, en aquest moment, en bona part madur. Els actors més dolents han estat eliminats.

No obstant això, quan confieu les vostres dades (en aquest cas, converses privades) a un tercer, confieu en elles per protegir-les. Això és tan cert per als serveis en línia com per als transcriptors humans.

En definitiva, has de preguntar-te dues coses: confies en el servei i quina sensibilitat són les teves converses?

Quan busqueu un servei de transcripció, sempre val la pena fer alguna investigació. L’empresa té una bona reputació? Està ben establert? Ha estat objecte d'una falta de dades en el passat? Hi ha una política de privadesa que expliqui explícitament com es gestionen i protegen les vostres dades?

Com hem esmentat anteriorment, els serveis basats en IA es basen sovint en empleats i contractistes de tercers per fer controls de control de qualitat. Si bé aquestes comprovacions representen una fracció de totes les transcripcions, sempre hi ha la possibilitat que algú escolti la vostra conversa.

Tot i això, en molts casos, no es tracta d'un desglossador. Tanmateix, si la vostra conversa és profundament privada o comercialment sensible, potser voldreu plantejar-vos obrir un editor de text i transcriure la forma antiga.