Internet jest pełen anonimowych kont. Jednak era prywatności w sieci może dobiegać końca. W badaniu dostępnym na serwerze preprintów arXiv naukowcy wykazują, że duże modele językowe (LLM) potrafią na dużą skalę identyfikować osoby stojące za tymi kontami.
Przez lata zakładano, że gdyby deanonimizacja była teoretycznie możliwa, okazałaby się zbyt czasochłonna, trudna i kosztowna. Autorzy badania mieli jednak przeczucie, że LLM stały się na tyle wydajne, aby rozwiązać to zagadnienie. Aby sprawdzić, czy jest to rzeczywiście możliwe, zespół zaprojektował zautomatyzowane ramy, które replikują proces decyzyjny badaczy, a następnie zaprzęgnął do pracy AI.
Najpierw sztuczna inteligencja analizowała historię postów użytkowników na Reddicie lub Hacker News, analizując nieustrukturyzowany tekst. Są to surowe, niezorganizowane informacje, takie jak komentarze, żarty, informacje edukacyjne i subtelne natręctwa pisarskie. Następnie przekształcała te mikrodane w matematyczną reprezentację profilu danej osoby, aby znaleźć dopasowania kandydatów wśród milionów innych profili w otwartej sieci lub na oddzielnych stronach, takich jak LinkedIn. W ramach badania znalazła potencjalne dopasowania, a następnie rozważała dowody wskazujące na to, że oba profile należą do tej samej osoby. Następnie przypisała przewidywanemu dopasowaniu wskaźnik pewności. Jeśli model nie był pewien, nie wpisywał nic, dzięki czemu naukowcy upewnili się, że nie konfabuluje.
Naukowcy przetestowali swoją platformę na prawie tysiącu profili LinkedIn, aby sprawdzić, czy AI jest w stanie dopasować je do kont w serwisie Hacker News. Były to profile, których prawdziwa tożsamość była znana zespołowi, ponieważ intencjonalnie usunął imiona, linki i inne oczywiste identyfikatory z ich profili.
Platforma oparta na sztucznej inteligencji skutecznie łączyła konta z dokładnością do 67%, podczas gdy najlepsze metody bez wykorzystania sztucznej inteligencji mają problemy z osiągnięciem wyraźnych sukcesów. Proces był również w stanie dopasować osoby w społecznościach Reddita, nawet jeśli użytkownicy rozkładali swoją aktywność na różne konta i byli aktywni w różnych przedziałach czasowych. Naukowcy doszli także do wniosku, że identyfikacja jest stosunkowo tania, a jej koszt w przeliczeniu na jedno połączone konto wynosi od 1 do 4 dolarów.
Wyniki pokazują, że w przypadku dalszego rozwoju system ten mógłby znaleźć zastosowanie w wielu dziedzinach, takich jak egzekwowanie prawa oraz cyberbezpieczeństwo.
(rr)
Kategoria wiadomości:
Inne
- Źródło:
- techxplore
Komentarze (0)
Czytaj także
-
Zrównoważone opakowania: najważniejsze trendy w branży spożywczej
Konsumenci stają się coraz bardziej świadomi ekologicznie, oczekując, że kupowana przez nich żywność będzie pakowana w opakowania nadające się do...
-
Kluczowa rola wycinarek laserowych w obróbce metali
Wycinarki laserowe zrewolucjonizowały przemysł obróbki metali, oferując niezwykłą precyzję i efektywność. Dowiedz się, dlaczego są one...
-
-
-
-
-