W przeszłości transkrypcja była złożonym i czasochłonnym zajęciem. Lekarze, dziennikarze oraz inni profesjonaliści nagrywali swoje notatki i rozmowy na taśmach dyktafonów, a następnie spędzali długie godziny przy komputerach, aby je spisać.
Obecnie, w erze 2020 roku, istnieje wiele narzędzi, które umożliwiają przekształcenie nagrań audio w tekst wyświetlany na ekranie. Istnieje jednak istotne pytanie: czy korzystanie z tych usług jest bezpieczne? W końcu użytkownicy mogą przesyłać nagrania poufnych rozmów i osobistych wiadomości głosowych.
Przyjrzyjmy się bliżej tym usługom oraz sposobom ochrony danych.
Jak funkcjonują usługi transkrypcji audio
Usługi transkrypcji audio można podzielić na trzy główne kategorie. Pierwsza z nich to systemy w pełni oparte na technologii komputerowej, które wykorzystują modele sztucznej inteligencji oraz uczenia maszynowego do przetwarzania rozmów. Druga kategoria, bardziej kosztowna, opiera się na pracy ludzkiej. Trzecia grupa to hybrydowe podejście, które łączy zarówno technologie komputerowe, jak i ludzki nadzór.
Najbardziej znaną kategorią są usługi transkrypcji głosu, takie jak te oferowane przez Google, Apple oraz Otter.ai, które przekształcają fale dźwiękowe generowane przez ludzki głos w ich cyfrowe odpowiedniki. Proces ten polega na podziale dźwięków na niewielkie fragmenty, które są następnie dopasowywane do znanych „fonemów” – podstawowych jednostek dźwiękowych w języku.
Algorytmy analizują te fonemy w kontekście innych dźwięków i poddają je modelom statystycznym oraz sztucznej inteligencji, co ostatecznie prowadzi do stworzenia tekstu. Usługi te, w pełni zautomatyzowane, zazwyczaj oferują najniższe koszty, jednak ich dokładność może pozostawiać wiele do życzenia, zwłaszcza w hałaśliwych lub zatłoczonych środowiskach.
Transkrypcja realizowana przez ludzi korzysta z platform takich jak Rev, które łączą klientów z zatwierdzonymi transkrybentami. Można także zlecić to zadanie freelancerom na platformach takich jak Upwork czy Fiverr.
Ostatnia kategoria to połączenie obu podejść, gdzie sztuczna inteligencja wykonuje wstępną transkrypcję, a następnie ludzki nadzorca poprawia ewentualne błędy i dopracowuje ostateczny tekst.
Przypadki naruszeń w usługach transkrypcyjnych
W ostatnich latach wiele usług transkrypcyjnych znalazło się w centrum skandali związanych z naruszeniem danych.
Jednym z najgłośniejszych przypadków był SpinVox, który w latach 2000 oferował usługę przekształcania poczty głosowej w wiadomości tekstowe. Uznawano to za przełom w technologii, co przyciągnęło liczne pozytywne opinii oraz inwestycje. Problem polegał na tym, że klienci nie byli świadomi, że ich wiadomości głosowe były przetwarzane przez pracowników biur w krajach takich jak Pakistan, Mauritius i RPA. Zaledwie 2% wiadomości było przetwarzanych automatycznie, a pozostałe były obsługiwane przez wyzyskiwanych pracowników.
Gdy pracownicy biura w Pakistanie nie otrzymywali wynagrodzenia, zaczęli wysyłać wiadomości bezpośrednio do klientów, co ujawniło całą sytuację. Ostatecznie SpinVox stracił na wartości, a firma została sprzedana Niuansowi, jednym z wiodących dostawców technologii rozpoznawania głosu.
Inny przypadek odkryty przez dziennikarza zajmującego się cyberbezpieczeństwem, Briana Krebsa, dotyczył poważnego naruszenia w firmie MEDantex, która świadczyła usługi transkrypcyjne dla lekarzy z Kansas. Wyciekły dane zawierały wrażliwe informacje medyczne, a pliki były dostępne do pobrania z niezabezpieczonego portalu jako dokumenty Microsoft Word.
Nawet usługi transkrypcyjne oparte na technologii komputerowej nie są wolne od ryzyka. W przypadku, gdy usługi są w pełni zautomatyzowane, nie można wykluczyć, że do kontroli jakości angażowani są ludzie.
W 2019 roku belgijski serwis informacyjny VRT NWS ujawnił, że kontrahenci Google podsłuchiwali rozmowy użytkowników z inteligentnymi asystentami Google Home. Niektórzy z tych kontrahentów udostępnili VRT NWS dostęp do nagrań, w tym wielu rozmów o charakterze intymnym.
Podobne praktyki stosowały także Amazon, Apple oraz Microsoft, co oznacza, że nie można wykluczyć podsłuchiwania nagrań głosowych użytkowników przez osoby trzecie.
Bezpieczeństwo usług transkrypcyjnych online
Kluczową kwestią pozostaje bezpieczeństwo usług transkrypcyjnych online. Niestety, odpowiedź na to pytanie jest złożona.
Obecnie rynek transkrypcji głosu jest stosunkowo dojrzały, a najwięksi nieuczciwi gracze zostali wyeliminowani.
Jednakże, powierzając swoje dane, w tym prywatne rozmowy, zewnętrznym podmiotom, polegasz na ich zdolności do ochrony tych informacji. Dotyczy to zarówno usług online, jak i transkrybentów.
Ostatecznie musisz zadać sobie dwa pytania: Czy ufasz danej usłudze oraz jak wrażliwe są Twoje rozmowy?
Przy wyborze usługi transkrypcyjnej warto przeprowadzić dokładne badania. Czy firma cieszy się dobrą reputacją? Jak długo działa na rynku? Czy miała w przeszłości problemy z naruszeniem danych? Czy istnieje polityka prywatności, która jasno określa, w jaki sposób przetwarzane i zabezpieczane są Twoje dane?
Jak już wspomniano, usługi oparte na sztucznej inteligencji często polegają na pracownikach zewnętrznych do przeprowadzania kontroli jakości. Mimo że takie kontrole są jedynie ułamkiem wszystkich transkrypcji, zawsze istnieje ryzyko, że ktoś może odsłuchiwać Twoje nagrania.
W wielu przypadkach nie jest to złamanie umowy, jednak jeśli Twoja rozmowa dotyczy bardzo prywatnych lub wrażliwych kwestii, warto rozważyć tradycyjne metody transkrypcji, takie jak ręczne spisywanie tekstu.
newsblog.pl
Maciej – redaktor, pasjonat technologii i samozwańczy pogromca błędów w systemie Windows. Zna Linuxa lepiej niż własną lodówkę, a kawa to jego główne źródło zasilania. Pisze, testuje, naprawia – i czasem nawet wyłącza i włącza ponownie. W wolnych chwilach udaje, że odpoczywa, ale i tak kończy z laptopem na kolanach.