𝗚𝗿𝗼𝗸 𝟯: 𝗗𝗲𝗿 𝗻𝗲𝘂𝗲 𝗠𝗮ß𝘀𝘁𝗮𝗯 𝗶𝗻 𝗱𝗲𝗿 𝗞𝗜-𝗪𝗲𝗹𝘁

Elon Musks Unternehmen x.AI hat heute sein neuestes Modell Grok 3 veröffentlicht.
Die neuesten Testergebnisse zeigen, dass Grok 3 in vielen Disziplinen führend ist und seine Konkurrenz in mehreren Kategorien übertrifft.

Grok 3 in den Benchmarks

Laut den aktuellen Daten, die von X stammen, hat Grok 3 seine Konkurrenten in mehreren standardisierten Tests übertroffen, darunter:

Mathematik (AIME’24 Benchmark): Grok 3 erreichte eine Punktzahl von 52. Ein direkter Vergleich mit OpenAIs o1 oder o3 sowie anderen Reasoning-Modellen wäre hier aussagekräftiger als mit GPT-4o.

𝗪𝗶𝘀𝘀𝗲𝗻𝘀𝗰𝗵𝗮𝗳𝘁 (𝗚𝗣𝗤𝗔 𝗕𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸): Grok 3 dominierte mit 75 Punkten, gefolgt von DeepSeek-V3 mit 65 Punkten.
𝗖𝗼𝗱𝗶𝗲𝗿𝘂𝗻𝗴 (𝗟𝗖𝗕 𝗕𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸, 𝗢𝗸𝘁.–𝗙𝗲𝗯.): Grok 3 erzielte einen Wert von 57 und übertraf damit Gemini-2 Pro sowie andere KI-Modelle deutlich.
𝗖𝗵𝗮𝘁𝗯𝗼𝘁 𝗔𝗿𝗲𝗻𝗮: Grok 3 dominiert

In der Chatbot Arena (LMSYS) zeigt sich ebenfalls die Stärke von Grok 3. Die "Chocolate"-Version des Modells führt die Rangliste mit einer beeindruckenden ELO-Wertung von fast 1400 Punkten an und schlägt damit Modelle wie DeepSeek-V3, Gemini 2.0, Claude 3.5 und OpenAIs o1.

𝗔𝗜𝗠𝗘 𝟮𝟬𝟮𝟱: Grok 3 mit geringem Abstand an der Spitze
Ein weiteres Highlight ist die AIME 2025 Performance, bei der Grok 3 erneut herausragt:

Grok 3 Reasoning Beta: 93 Punkte
Grok 3 Mini Reasoning: 90 Punkte
o3mini (high): 87 Punkte
o1 (OpenAI): 79 Punkte

Was macht Grok 3 so besonders?

𝗟𝗲𝗶𝘀𝘁𝘂𝗻𝗴𝘀𝗳ä𝗵𝗶𝗴𝗲 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗸𝘁𝘂𝗿: Grok 3 wurde auf dem Colossus Supercomputer mit 200.000 NVIDIA H100 GPUs trainiert und bietet eine erhebliche Rechenleistung.

𝗙𝗼𝗸𝘂𝘀 𝗮𝘂𝗳 𝗥𝗲𝗮𝘀𝗼𝗻𝗶𝗻𝗴 & 𝗣𝗿𝗼𝗯𝗹𝗲𝗺𝗹ö𝘀𝘂𝗻𝗴: Das Modell zeigt solide Ergebnisse in Mathematik und Wissenschaft durch verbesserte logische Schlussfolgerungen.

𝗘𝗳𝗳𝗶𝘇𝗶𝗲𝗻𝘁𝗲 𝗩𝗲𝗿𝗮𝗿𝗯𝗲𝗶𝘁𝘂𝗻𝗴: Grok 3 bearbeitet Anfragen schneller als sein Vorgänger und liefert präzisere Antworten.

Vergleich mit OpenAI-Modellen: Während o1 und o3 von OpenAI in vielen Bereichen stark sind, zeigt sich Grok 3 in bestimmten Disziplinen überlegen.

Fazit: Wie wird OpenAI reagieren?

Die kommenden Monate werden zeigen, wie sich das Modell in der Praxis bewährt und ob OpenAI sowie andere Marktführer mit ihren kommenden Generationen eine Antwort darauf finden.

Schickt Sam Altman nun GPT-4.5 ins Rennen oder gleich GPT-5 aka Orion als wohl erste AGI? Es bleibt spannend, und wie reagieren die anderen Teilnehmer, ebenfalls mit neuen Modellen und weniger Restriktionen? Und wie ist um den Datenschutz bei Grok3 bestellt?

𝘞ä𝘩𝘳𝘦𝘯𝘥 𝘥𝘪𝘦 𝘜𝘚𝘈 𝘶𝘯𝘥 𝘊𝘩𝘪𝘯𝘢 𝘪𝘯 𝘥𝘢𝘴 𝘨𝘰𝘭𝘥𝘦𝘯𝘦 𝘡𝘦𝘪𝘵𝘢𝘭𝘵𝘦𝘳 𝘥𝘦𝘳 𝘒𝘐 𝘶𝘯𝘥 𝘙𝘰𝘣𝘰𝘵𝘪𝘬 𝘦𝘪𝘯𝘵𝘳𝘦𝘵𝘦𝘯, 𝘩ä𝘭𝘵 𝘥𝘪𝘦 𝘌𝘜 𝘵𝘳𝘰𝘵𝘻𝘪𝘨 𝘢𝘯 𝘪𝘩𝘳𝘦𝘮 𝘶𝘮𝘴𝘵𝘳𝘪𝘵𝘵𝘦𝘯𝘦𝘯 𝘌𝘜-𝘒𝘐-𝘈𝘤𝘵 𝘧𝘦𝘴𝘵.

Quelle Images: X (ehemals Twitter)

🔥 Bleib am Puls der Zeit – alle News, Fakten und was du wissen solltest, hier auf meinem Blog oder Wegsite!

🔥Stay curious - all the latest news, insights ahd must know facts, right here on my Blog or Website!

CognitiveIntelligence Coaching AI KI StefanTrauth TrauthInterim

Accounting

AGI Munich LernenmitKI LearningwithAI Arbeitswelt ZukunftderArbeit

FTE

Mitarbeiter Workingworld FutureofWork

selbstbewusstsein Empathie heilung leadership lebensweisheiten

lebensfreude

bewusstleben StefanTrauth achtsamkeit persönlichkeitsentwicklung

innererfrieden seelenfrieden selfcare empatia spirituality

Hashtag

__________________________________________

Excellence in Finance - Accounting - Digitalization - Visionary AI Architect | Pi(π) guides our way | Innovation Leader in Bi-Directional Hypnosis & Founder: Hypnotheris®: Inspire, Lead, Innovate

FutureFusion: Visionär - Provokativ - Authentisch

English Blog Version

Über mich

Dienstag, 18. Februar 2025

𝗚𝗿𝗼𝗸 𝟯: 𝗗𝗲𝗿 𝗻𝗲𝘂𝗲 𝗠𝗮ß𝘀𝘁𝗮𝗯 𝗶𝗻 𝗱𝗲𝗿 𝗞𝗜-𝗪𝗲𝗹𝘁

Keine Kommentare:

Kommentar veröffentlichen

100 Millionen – das war das Ziel.