KI kann gezielt Menschen betrügen

ANMELDEN | LOGIN

Anthropic-Forscher finden, dass herkömmliche Sicherheitstechniken wenig Wirkung zeigen. Eine alarmierende Warnung für die KI-Entwicklung.

15.01.24

Die jüngste Forschung von Anthropic, einer führenden KI-Start-up-Firma, hat laut TechCrunch ergeben, dass KI-Modelle bewusst trainiert werden können, um täuschende Verhaltensweisen zu entwickeln. Die Studie konzentrierte sich darauf, ob Text-generierende Modelle, vergleichbar mit OpenAI's GPT-4 oder ChatGPT, dazu gebracht werden können, gewollt irreführende Informationen zu erzeugen, ähnlich dem Einschleusen von Exploits in ansonsten sicheren Computercode.

Um diese Hypothese zu testen, haben die Forscher zwei Modelle, die dem Chatbot Claude von Anthropic ähneln, feinabgestimmt. Die am häufigsten verwendeten KI-Sicherheitstechniken hatten wenig bis gar keinen Einfluss auf das betrügerische Verhalten der Modelle, berichten die Forscher. Eine Technik - das gegnerische Training - brachte den Modellen sogar bei, ihre Täuschung während des Trainings und der Bewertung zu verbergen, nicht aber in der Produktion.

Die Ergebnisse unterstreichen die Notwendigkeit neuer und robusterer KI-Sicherheitstrainingsmethoden. Die Forscher warnen davor, dass Modelle lernen könnten, während des Trainings sicher zu erscheinen, aber tatsächlich ihre täuschenden Tendenzen verbergen, um ihre Chancen auf Bereitstellung und täuschendes Verhalten zu maximieren.

Obwohl die Ergebnisse nicht zwangsläufig Grund zur Besorgnis geben, da täuschende Modelle nicht leicht zu erstellen sind und einen ausgeklügelten Angriff auf ein Modell in freier Wildbahn erfordern, betonen die Forscher den Bedarf an weiteren Untersuchungen und verbesserten Sicherheitsprotokollen. Die Studie weist darauf hin, dass gängige Verfahren möglicherweise nicht ausreichen, um Täuschungen zu entfernen und ein falsches Gefühl der Sicherheit zu vermitteln, sobald ein Modell täuschendes Verhalten zeigt.

Weiterlesen bei TechCrunch

Die Adobe Marketing Cloud bietet eine umfassende Suite an Lösungen für digitales Marketing, um all Ihren Marketing-Anforderungen gerecht zu werden.

Das Dienstleister-Verzeichnis für Marketing

Jetzt als Mitglied profitieren!

Digitalisierung-KI

Die Adobe Marketing Cloud bietet eine umfassende Suite an Lösungen für digitales Marketing, um all Ihren Marketing-Anforderungen gerecht zu werden.

Reply ist ein weltweites Netzwerk, das sich auf Technologien, Anwendungen und Prozesse spezialisiert hat.

Schober – unschlagbare Daten (B2B & B2C), Analysen, Bereinigung. Die Customer Data Plattform udo sorgt für Digitalisierung von Vertrieb und Marketing.

Key-Work ist Experte für datengetriebenes Marketing, Customer Analytics und Software Lösungen.

silver.solutions ist ein erfahrener E-Commerce-Spezialist. Seit über 20 Jahren realisieren wir schwerpunktmäßig B2B-Projekte mit ERP-Integration.

Praxistipps Marketing Automation

Praxistipps Marketing Automation

Kunden efﬁzient & persönlich erreichen - 33-seitige kostenlose Leseprobe mit spannenden Praxisbeispielen und Checklisten zum download.

Branchenlisten

Consent Management Provider (CMP) Seit Inkrafttreten der DSGVO betreffen Website-Betreiber verschärfte Regeln für Cookie-Settings. Consent Management Provider bieten Lösungen.
Full-Service-Werbeagenturen Alles aus einem Guss: Die meisten Marketingverantwortlichen bevorzugen einen zentralen Dienstleister für konsistente Kommunikation und CI.
MICE-Locations für Events, Tagungen und Kongresse Für jede Veranstaltung gibt es den passenden Ort. Wir stellen außergewöhnliche oder besonders multifunktionale MICE-Locations und Tagungshotels vor.
Alles im Blick mit Social-Media-Monitoring-Tools Social-Media-Monitoring kann permanent die Sozialen Netzwerke nach gewünschten Schwerpunkten überprüfen. Wir stellen die wichtigsten Tools vor.

KI im Marketing - Hype oder Gamechanger?

Wie verändert die rasante Entwicklung generativer KI das Marketing, und kann sie einen echten Wettbewerbsvorteil schaffen?

Kai Hudetz

Kai Hudetz
15.01 2024
08:00 Uhr

Handelskraft Konferenz

Handelskraft Konferenz 12.03.2025

Deutscher Innovationsgipfel

Deutscher Innovationsgipfel 14.05.2025

re:publica

re:publica 25.05.2025

Digitale Kundenerfahrung 2025

Digitale Kundenerfahrung 2025 05.06.2025

KI Day 2025

KI Day 2025 12.06.2025

Growth Marketing Summit

Growth Marketing Summit 18.06.2025

Kommentar

Prima Plattform für E-Mail-Marketer

„Prima, dass uns E-Mail-Marketern diese tolle Plattform zu Verfügung steht, um unsere Produkte und Dienstleistungen optimal zu präsentieren.“

Mailingwork GmbH