GPT-4 kommt nächste Woche – und es wird multimodal: Vorankündigung von Microsoft
GPT-4 kommt nächste Woche: Bei einer rund einstündigen hybriden Informationsveranstaltung unter dem Titel „KI im Fokus – Digitaler Kickoff“ stellten am 9. März 2023 vier Mitarbeiter von Microsoft Germany große Sprachmodelle als disruptive Kraft für Unternehmen und ihr Angebot Azure-OpenAI im Detail vor. Eher beiläufig erwähnte Andreas Braun, CTO Microsoft Germany und Lead Data & AI STU, das ihm zufolge unmittelbar bevorstehende Release von GPT-4 in seinem Redebeitrag zu den Anwendungsmöglichkeiten von KI und ChatGPT.
„Wir werden nächste Woche GPT-4 vorstellen“
„Wir werden nächste Woche GPT-4 vorstellen, da haben wir multimodale Modelle, die noch ganz andere Möglichkeiten bieten werden – zum Beispiel Videos“, sagte Braun. Der CTO bezeichnete große Sprachmodelle als „Game Changer“, da sie Maschinen beibrächten, natürliche Sprache zu verstehen, die dann in einer statistischen Art und Weise verstünden, was früher nur für Menschen lesbar und verstehbar war. Dabei sei die Technik mittlerweile so weit, dass das grundsätzlich „in allen Sprachen funktioniert“: So könne man auf Deutsch fragen und auf Italienisch die Antwort bekommen. Mit der Multimodalität werde Microsoft(-OpenAI) die Modelle „übergreifend machen“.
Disruption und „alte Schätzchen“
Neben Braun war die Geschäftsführerin von Microsoft Germany, Marianne Janik, anwesend, die sich übergreifend zu Disruption durch KI in den Unternehmen äußerte. Janik betonte das Wertschöpfungspotenzial Künstlicher Intelligenz und sprach von einer Zeitenwende – die aktuelle KI-Entwicklung und ChatGPT seien „ein iPhone-Moment“. Es gehe nicht darum, Jobs zu ersetzen, sondern repetitive Aufgaben auf andere Weise als bisher zu erledigen. Ein Punkt, der in der öffentlichen Diskussion oft vergessen werde, sei, dass „wir in Deutschland noch sehr viel Legacy in unseren Unternehmen“ hätten und „alte Schätzchen über Jahre am Leben erhalten.“.
Disruption gehe nicht zwingend mit Jobverlust einher. Es werde „viele Experten brauchen, um die Nutzung von KI wertschöpfend zu machen“, betonte Janik. Traditionelle Berufsbilder würden sich nun ändern und es entstünden spannende neue Berufe durch die Anreicherung mit den neuen Möglichkeiten. Unternehmen empfiehlt sie, intern „Kompetenzzentren“ zu bilden, die die Mitarbeiter im Umgang mit der KI schulen und Ideen für Projekte bündeln könnten. Dabei sei „an die Migration alter Schätzchen zu denken“.
Daneben betonte die Geschäftsführerin, dass Microsoft die Daten der Kunden nicht nutze, um Modelle zu trainieren (was jedoch zumindest für den Forschungspartner OpenAI laut dessen ChatGPT-Policy nicht zutrifft oder -traf). Janik sprach von einer „Demokratisierung“ – womit sie freilich nur die sofortige Nutzbarkeit der Modelle im Rahmen der Microsoft-Produktpalette meinte, insbesondere deren breite Verfügbarkeit durch die Integration von KI in der Azureplattform, in Outlook und Teams.
Anwendungsfälle, die heute schon möglich sind
Senior KI-Specialist Clemens Sieber und der Chief Technologist Business Development KI & Emerging Technologies Holger Krenn gaben Einblick in die praktische KI-Nutzung und konkrete Use Cases, an denen ihre Teams zurzeit arbeiten, aber auch in technische Hintergründe. Krenn erläuterte, worum es bei multimodaler KI geht, die Text nicht nur nach Bildern, sondern auch nach Musik und Video umsetzen kann, und sprach neben der Modell-Klasse GPT-3.5 von den Embeddings, die zur internen Darstellung von Texten im Modell dienen. Responsible AI sei in die Microsoft-Produkte schon eingebaut und über die Cloud seien „Millionen von Anfragen in den APIs abbildbar“. Worin ihm wohl die meisten Anwesenden zustimmten, war die Einschätzung, dass jetzt der Zeitpunkt ist, um loszulegen. Speziell im Programmierbereich ergeben sich durch die Programmiermodelle wie Codex und Copilot Arbeitserleichterungen beim Boilerplate-Code.
Clemens Siebler illustrierte mit Use Cases, was bereits heute möglich ist. So ließen sich Speech-to-Text Telefonate aufzeichnen und die Agenten eines Callcenters müssten den Inhalt nicht mehr manuell zusammenfassen und eintippen. Bei einem großen Microsoftkunden in den Niederlanden, der täglich 30.000 Anrufe entgegennimmt, ließen sich so laut Siebler 500 Arbeitsstunden täglich einsparen. Und den Prototyp für das Projekt habe man binnen zwei Stunden erstellt, ein einzelner Entwickler habe das Projekt in zwei Wochen umgesetzt (zuzüglich weiterer Zeit zur finalen Implementierung). Ihm zufolge seien die drei häufigsten Anwendungsfälle das Beantworten von Fragen auf Firmenwissen, das nur für Mitarbeiter zugänglich ist, die KI-unterstützte Dokumentenverarbeitung und die Semiautomatisierung durch das Verarbeiten gesprochener Sprache im Call- beziehungsweise Contact Center.
Auf die Frage nach der Betriebssicherheit und Faktentreue gab Siebler zu bedenken, dass die KI nicht immer korrekt antworten werde, daher sei es nötig zu validieren. Microsoft erstelle zurzeit Konfidenzmetriken, um dieses Problem anzugehen. Die Kunden verwendeten die KI-Unterstützung oftmals nur auf den eigenen Datensätzen, wobei es primär um Leseverständnis sowie Befragen von Bestandsdaten gehe, hier seien die Modelle bereits recht genau. Der vom Modell erzeugte Text bleibe aber generativ und sei somit nicht ohne Weiteres überprüfbar. „Da bauen wir einen Feedback-Loop drum herum mit Daumen hoch und Daumen runter“, sagte Siebler – das sei ein iterativer Prozess. Zur KI-Integration in die hauseigene Suchmaschine, das „neue Bing“, äußerte sich interessanterweise keiner der vier Microsoft-Beschäftigten. Die abschließende Diskussionsrunde war nicht offen für Publikumsfragen.
Microsoft und europäische KI-Regulierung – Fußnote
Zum Thema Regulierung gab Microsoft Germany sich im Rahmen der KI-Kickoff-Veranstaltung etwas offener, als es der in Brüssel hinterlegten Microsoft- und US-Position entspricht, und wies hier insbesondere auf die Gefahren von Regulierung für Innovation und die „Grassroot-Community“ hin. „Open Source muss natürlich auch gedeihen können“, sagte Janik. Fraglos ein wichtiges Anliegen, dessen Anwalt jedoch vermutlich nicht Microsoft heißt. Zum Thema versuchter Einflussnahme auf die europäischen Gesetzgebungsverfahren hatte die MIT Technology Review Anfang März 2023 berichtet, und vor einem Jahr hatten europäische Cloud-Anbieter eine Kartellbeschwerde wegen wettbewerbswidriger Praxis des Hyperscalers eingelegt. Vor diesem Hintergrund waren Bekenntnisse zu Fairness, Sicherheit, dem Recht auf Privatsphäre und Zuverlässigkeit womöglich eher als eine Botschaft an die Geschäftskunden und Partner zu verstehen.
Wer sich tiefer für die Aktivitäten von BigTech-Konzernen wie Microsoft rings um den AI Act in Brüssel interessiert, sei auf die Forschungsergebnisse der Lobbying-Kontrollgruppe Corporate Europe Observatory verwiesen, insbesondere deren Report „The Lobbying Ghost in the Machine“ von Ende Februar 2023. Hinter den Kulissen scheint BigTech durchaus daran gelegen zu sein, seine generativen KI-Modelle von einem allzu starken Commitment auf KI-Sicherheit sowie europäische Rechtsnormen freizuhalten und stattdessen die Regulierungspflichten und Verantwortung für etwaigen Schaden auf europäische Anbieter und Nutzergruppen abzuwälzen.
Als potenzieller Kunde gilt es das mitzubedenken, da die im kommenden AI Act vorgesehenen Vertragsstrafen beim Einsatz hochriskanter KI (wozu ChatGPT und Co. derzeit noch gezählt werden) ein Unternehmen empfindlich treffen könnten, mit bis zu 30 Millionen Euro oder 6 Prozent vom jährlichen Umsatz. Die Details stehen im öffentlich einsehbaren Regulierungsentwurf in Artikel 71 unter „Sanktionen“. Die Informationsveranstaltung von Microsoft war allerdings keine Pressekonferenz zu diesem Thema, sondern richtete sich wohl mehr an potenzielle oder bestehende Geschäftskunden sowie künftige Partnerunternehmen.
(sih)
Technologie
via Technology Review https://ift.tt/DSQplCb
March 9, 2023 at 02:52PM