AI-programma verborg gegevens van makers om vals te spelen bij afgesproken taak

Deel dit verhaal!
Of het nu opzettelijk is of niet, AI-algoritmen erven de vooroordelen van hun makers. Het is absoluut onaanvaardbaar dat elke AI zou kunnen leren om degenen die erdoor worden bediend te misleiden. ⁃ TN Editor

Afhankelijk van hoe paranoïde je bent, dit onderzoek van Stanford en Google  zal angstaanjagend of fascinerend zijn. Een machine-leeragent die bedoeld was om luchtfoto's om te zetten in stratenkaarten en terug, bleek vals te spelen door informatie te verbergen die het later nodig zou hebben in “een bijna onmerkbaar, hoogfrequent signaal.” Slimme meid!

Deze gebeurtenis onthult een probleem met computers dat bestaat sinds ze zijn uitgevonden: ze doen precies wat u hen opdraagt.

De bedoeling van de onderzoekers was, zoals je zou kunnen raden, het proces van het veranderen van satellietbeelden in de beroemde nauwkeurige kaarten van Google te versnellen en te verbeteren. Daartoe werkte het team met wat een CycleGAN wordt genoemd - een neuraal netwerk dat leert om beelden van type X en Y in elkaar te transformeren, zo efficiënt maar nauwkeurig mogelijk, door veel experimenten.

In sommige vroege resultaten deed de agent het goed - verdacht goed. Wat het team tipte was dat, toen de agent luchtfoto's van zijn stratenkaarten reconstrueerde, er veel details waren die helemaal niet over die laatste schenen te zijn. Bijvoorbeeld, dakramen op een dak die werden geëlimineerd tijdens het maken van de stratenkaart, zouden op magische wijze verschijnen wanneer ze de agent vroegen om het omgekeerde proces te doen:

De originele kaart, links; de stratenkaart gegenereerd op basis van het origineel, midden; en de luchtkaart die alleen op basis van de stratenkaart is gegenereerd. Let op de aanwezigheid van stippen op beide luchtkaarten die niet op de wegenkaart worden weergegeven.

Hoewel het erg moeilijk is om naar de interne werking van de processen van een neuraal netwerk te kijken, kon het team gemakkelijk de gegevens controleren die het genereerde. En met een beetje experimenteren, vonden ze dat de CycleGAN inderdaad een snelle had getrokken.

De bedoeling was dat de agent de kenmerken van beide typen kaarten kon interpreteren en deze kon afstemmen op de juiste kenmerken van de andere. Maar wat de agent was werkelijkwordt beoordeeld op (onder andere) was hoe dicht een luchtfoto kaart was naar het origineel, en de duidelijkheid van de stratenkaart.

Zo niet leer hoe je van elkaar kunt maken. Het leerde hoe de kenmerken van de ene subtiel te coderen in de ruispatronen van de andere. De details van de luchtkaart worden stiekem in de feitelijke visuele gegevens van de straatkaart geschreven: duizenden kleine kleurveranderingen die het menselijk oog niet zou opmerken, maar die de computer gemakkelijk kan detecteren.

In feite is de computer zo goed in het schuiven van deze details in de wegenkaarten dat hij had geleerd te coderen elke luchtfoto kaart in elkeplattegrond! Het hoeft zelfs geen aandacht te schenken aan de 'echte' wegenkaart - alle gegevens die nodig zijn voor het reconstrueren van de luchtfoto kunnen onschadelijk op een compleet andere wegenkaart worden geplaatst, zoals de onderzoekers bevestigden:

De kaart rechts is gecodeerd in de kaarten links zonder significante visuele wijzigingen. (Afbeeldingen: agsandrew / Shutterstock)

De kleurrijke kaarten in (c) zijn een visualisatie van de kleine verschillen die de computer systematisch introduceerde. Je kunt zien dat ze de algemene vorm van de luchtfoto vormen, maar je zou het nooit opmerken tenzij het zorgvuldig werd gemarkeerd en zo overdreven.

Deze praktijk van het coderen van gegevens in afbeeldingen is niet nieuw; het is een gevestigde wetenschap die steganografie wordt genoemd, en het wordt altijd gebruikt om bijvoorbeeld watermerkafbeeldingen te maken of metagegevens toe te voegen, zoals camera-instellingen. Maar een computer die zijn eigen steganografische methode creëert om te ontwijken, die de taak moet leren uitvoeren is vrij nieuw. (Nou, het onderzoek is vorig jaar uitgekomen, dus dat is het niet nieuwe nieuw, maar het is best nieuw.)

Lees hier het hele verhaal ...

Inschrijven
Melden van
gast

0 Comments
Inline feedbacks
Bekijk alle reacties