Vergeet Siri en Alexa - De 'NSA Reigns Supreme' in Voice Identification

Deel dit verhaal!
Waarom worden luistersensoren geïnstalleerd in lichtmasten, bushaltes en camera's overal in slimme steden? "Zodra je iemands stem kunt identificeren, kun je ze onmiddellijk vinden wanneer ze een gesprek voeren." Technocraten vertrouwen op totale bewaking voor uitgebreide sociale engineering van de hele bevolking. ⁃ TN-editor

At de hoogte van de Koude Oorlog, tijdens de winter van 1980, namen FBI-agenten een telefoongesprek op waarin een man een geheime ontmoeting regelde met de Sovjet-ambassade in Washington, DC Op de dag van zijn benoeming konden agenten de man die de ambassade betreedt. Destijds konden ze de beller niet alleen met het geluid van zijn stem een ​​naam geven, dus de spion bleef anoniem. In de komende vijf jaar verkocht hij details over verschillende geheime Amerikaanse programma's aan de USSR.

Het was pas 1985 dat de FBI, dankzij informatie van een Russische overloper, de beller kon vaststellen als Ronald Pelton, een voormalig analist bij de National Security Agency. Het volgende jaar werd Pelton veroordeeld voor spionage.

Vandaag zouden FBI- en NSA-agenten Pelton binnen enkele seconden na zijn eerste oproep aan de Sovjets hebben geïdentificeerd. EEN geclassificeerde NSA-memo vanaf januari beschrijft 2006 NSA-analisten een "technologie die mensen identificeert aan de hand van hun stem" om oude audiobestanden van Pelton met elkaar te matchen. "Als dergelijke technologieën twintig jaar geleden beschikbaar zouden zijn geweest," verklaarde de memo, "had vroege detectie en aanhouding mogelijk kunnen zijn, waardoor de aanzienlijke schade die Pelton aan de nationale veiligheid heeft toegebracht, werd verminderd."

Deze en andere geclassificeerde documenten verstrekt door voormalig NSA-aannemer Edward Snowden onthullen dat de NSA technologie heeft ontwikkeld, niet alleen om privégesprekken op te nemen en te transcriberen, maar ook om automatisch de sprekers te identificeren.

Amerikanen komen deze technologie, bekend als luidsprekerherkenning of luidsprekeridentificatie, het meest tegen wanneer ze Amazon's Alexa wakker maken of hun bank bellen. Maar tien jaar voordat spraakcommando's als "Hallo Siri" en "OK Google" gemeenschappelijke woorden werden, gebruikte de NSA sprekerherkenning om terroristen, politici, drugsbaronnen, spionnen en zelfs uitzendkrachten te volgen.

De technologie analyseert de fysieke en gedragskenmerken die de stem van elke persoon onderscheiden, zoals de toonhoogte, de vorm van de mond en de lengte van het strottenhoofd. Een algoritme maakt vervolgens een dynamisch computermodel van de vocale kenmerken van het individu. Dit is wat in de volksmond een "voiceprint" wordt genoemd. Het hele proces - een paar gesproken woorden vastleggen, die woorden omzetten in een voiceprint en die weergave vergelijken met andere "voiceprints" die al in de database zijn opgeslagen - kan bijna onmiddellijk gebeuren. Hoewel bekend is dat de NSA afhankelijk is van vinger- en gezichtsafdrukken om doelen te identificeren, zijn stemafdrukken volgens een 2008-document "waar NSA heerst".

Het is niet moeilijk om te zien waarom. Door miljoenen buitenlandse telefoongesprekken, videoteleconferenties en internetoproepen te onderscheppen en op te nemen - naast het opnemen, met of zonder warrants, van de binnenlandse gesprekken van Amerikanen - heeft de NSA een ongeëvenaarde verzameling van verschillende stemmen opgebouwd. documenten uit het Snowden-archief onthullen dat analisten sommige van deze opnames toevoegden aan sprekerherkenningsalgoritmen die individuen konden verbinden met hun eerdere uitingen, zelfs wanneer ze onbekende telefoonnummers, geheime codewoorden of meerdere talen hadden gebruikt.

Al in Operatie Iraqi Freedom, analisten gebruikten sprekerherkenning om te verifiëren dat audio die "leek van de afgezette leider Saddam Hussein inderdaad van hem was, in tegenstelling tot de heersende opvattingen." Memo's laten verder zien dat NSA-analisten voiceprints creëerden voor Osama bin Laden, wiens stem "onmiskenbaar en opmerkelijk consistent was in verschillende uitzendingen ; ”Voor Ayman al-Zawahri, de huidige leider van Al Qaeda; en voor Abu Musab al-Zarqawi, dan het derde commando van de groep. Ze gebruikten de stemafdruk van Zarqawi om hem te identificeren als de spreker in online geposte audiobestanden.

De geclassificeerde documenten, daterend van 2004 tot 2012, tonen de NSA verfijning van steeds verfijndere iteraties van haar luidsprekerherkenningstechnologie. Ze bevestigen het gebruik van sprekerherkenning bij terrorismebestrijdingsoperaties en buitenlandse drugsstoringen. En ze suggereren dat het bureau van plan was om de technologie niet alleen in te zetten om spionnen zoals Pelton met terugwerkende kracht te identificeren, maar ook om klokkenluiders zoals Snowden te voorkomen.

Altijd luisteren

Civiele vrijheidsexperts maken zich zorgen dat deze en andere uitbreidende toepassingen van luidsprekerherkenning het recht op privacy in gevaar brengen. "Dit creëert een nieuwe intelligentiecapaciteit en een nieuwe mogelijkheid voor misbruik", aldus Timothy Edgar, een voormalige adviseur van het Witte Huis aan de directeur van de nationale inlichtingendienst. “Onze stem reist via allerlei communicatiekanalen waar we er niet zijn. In een tijdperk van massale surveillance heeft dit soort capaciteiten ingrijpende gevolgen voor al onze privacy. "

Edgar en andere experts wezen op de relatief stabiele aard van de menselijke stem, die veel moeilijker te veranderen of te verbergen is dan een naam, adres, wachtwoord, telefoonnummer of pincode. Dit maakt het "veel gemakkelijker" om mensen te volgen, aldus Jamie Williams, een advocaat bij de Electronic Frontier Foundation. "Zodra je iemands stem kunt herkennen," zei ze, "kun je ze onmiddellijk vinden wanneer ze een gesprek voeren, ervan uitgaande dat je een opname maakt of ernaar luistert."

De stem is een unieke en gemakkelijk toegankelijke biometrie: in tegenstelling tot DNA kan het passief en op grote afstand worden verzameld, zonder medeweten of toestemming van een proefpersoon. De nauwkeurigheid varieert aanzienlijk, afhankelijk van hoe nauw de condities van de verzamelde stem overeenkomen met die van eerdere opnames. Maar in gecontroleerde omgevingen - met weinig achtergrondgeluid, een vertrouwde akoestische omgeving en een goede signaalkwaliteit - kan de technologie een paar gesproken zinnen gebruiken om precies op de persoon te passen. En hoe meer samples van een bepaalde stem er in het computermodel worden ingevoerd, hoe sterker en 'volwassener' dat model wordt.

Lees hier het hele verhaal ...

Inschrijven
Melden van
gast

0 Heb je vragen? Stel ze hier.
Inline feedbacks
Bekijk alle reacties