English Blog Version

Dienstag, 18. Februar 2025

๐—š๐—ฟ๐—ผ๐—ธ ๐Ÿฏ: ๐——๐—ฒ๐—ฟ ๐—ป๐—ฒ๐˜‚๐—ฒ ๐— ๐—ฎรŸ๐˜€๐˜๐—ฎ๐—ฏ ๐—ถ๐—ป ๐—ฑ๐—ฒ๐—ฟ ๐—ž๐—œ-๐—ช๐—ฒ๐—น๐˜





Elon Musks Unternehmen x.AI hat heute sein neuestes Modell Grok 3 verรถffentlicht.
Die neuesten Testergebnisse zeigen, dass Grok 3 in vielen Disziplinen fรผhrend ist und seine Konkurrenz in mehreren Kategorien รผbertrifft.

Grok 3 in den Benchmarks

Laut den aktuellen Daten, die von X stammen, hat Grok 3 seine Konkurrenten in mehreren standardisierten Tests รผbertroffen, darunter:

Mathematik (AIME’24 Benchmark): Grok 3 erreichte eine Punktzahl von 52. Ein direkter Vergleich mit OpenAIs o1 oder o3 sowie anderen Reasoning-Modellen wรคre hier aussagekrรคftiger als mit GPT-4o.




๐—ช๐—ถ๐˜€๐˜€๐—ฒ๐—ป๐˜€๐—ฐ๐—ต๐—ฎ๐—ณ๐˜ (๐—š๐—ฃ๐—ค๐—” ๐—•๐—ฒ๐—ป๐—ฐ๐—ต๐—บ๐—ฎ๐—ฟ๐—ธ): Grok 3 dominierte mit 75 Punkten, gefolgt von DeepSeek-V3 mit 65 Punkten.
๐—–๐—ผ๐—ฑ๐—ถ๐—ฒ๐—ฟ๐˜‚๐—ป๐—ด (๐—Ÿ๐—–๐—• ๐—•๐—ฒ๐—ป๐—ฐ๐—ต๐—บ๐—ฎ๐—ฟ๐—ธ, ๐—ข๐—ธ๐˜.–๐—™๐—ฒ๐—ฏ.): Grok 3 erzielte einen Wert von 57 und รผbertraf damit Gemini-2 Pro sowie andere KI-Modelle deutlich.
๐—–๐—ต๐—ฎ๐˜๐—ฏ๐—ผ๐˜ ๐—”๐—ฟ๐—ฒ๐—ป๐—ฎ: Grok 3 dominiert

In der Chatbot Arena (LMSYS) zeigt sich ebenfalls die Stรคrke von Grok 3. Die "Chocolate"-Version des Modells fรผhrt die Rangliste mit einer beeindruckenden ELO-Wertung von fast 1400 Punkten an und schlรคgt damit Modelle wie DeepSeek-V3, Gemini 2.0, Claude 3.5 und OpenAIs o1.

๐—”๐—œ๐— ๐—˜ ๐Ÿฎ๐Ÿฌ๐Ÿฎ๐Ÿฑ: Grok 3 mit geringem Abstand an der Spitze
Ein weiteres Highlight ist die AIME 2025 Performance, bei der Grok 3 erneut herausragt:

Grok 3 Reasoning Beta: 93 Punkte
Grok 3 Mini Reasoning: 90 Punkte
o3mini (high): 87 Punkte
o1 (OpenAI): 79 Punkte





Was macht Grok 3 so besonders?

๐—Ÿ๐—ฒ๐—ถ๐˜€๐˜๐˜‚๐—ป๐—ด๐˜€๐—ณรค๐—ต๐—ถ๐—ด๐—ฒ ๐—”๐—ฟ๐—ฐ๐—ต๐—ถ๐˜๐—ฒ๐—ธ๐˜๐˜‚๐—ฟ: Grok 3 wurde auf dem Colossus Supercomputer mit 200.000 NVIDIA H100 GPUs trainiert und bietet eine erhebliche Rechenleistung.

๐—™๐—ผ๐—ธ๐˜‚๐˜€ ๐—ฎ๐˜‚๐—ณ ๐—ฅ๐—ฒ๐—ฎ๐˜€๐—ผ๐—ป๐—ถ๐—ป๐—ด & ๐—ฃ๐—ฟ๐—ผ๐—ฏ๐—น๐—ฒ๐—บ๐—นรถ๐˜€๐˜‚๐—ป๐—ด: Das Modell zeigt solide Ergebnisse in Mathematik und Wissenschaft durch verbesserte logische Schlussfolgerungen.

๐—˜๐—ณ๐—ณ๐—ถ๐˜‡๐—ถ๐—ฒ๐—ป๐˜๐—ฒ ๐—ฉ๐—ฒ๐—ฟ๐—ฎ๐—ฟ๐—ฏ๐—ฒ๐—ถ๐˜๐˜‚๐—ป๐—ด: Grok 3 bearbeitet Anfragen schneller als sein Vorgรคnger und liefert prรคzisere Antworten.

Vergleich mit OpenAI-Modellen: Wรคhrend o1 und o3 von OpenAI in vielen Bereichen stark sind, zeigt sich Grok 3 in bestimmten Disziplinen รผberlegen.

Fazit: Wie wird OpenAI reagieren?

Die kommenden Monate werden zeigen, wie sich das Modell in der Praxis bewรคhrt und ob OpenAI sowie andere Marktfรผhrer mit ihren kommenden Generationen eine Antwort darauf finden.

Schickt Sam Altman nun GPT-4.5 ins Rennen oder gleich GPT-5 aka Orion als wohl erste AGI? Es bleibt spannend, und wie reagieren die anderen Teilnehmer, ebenfalls mit neuen Modellen und weniger Restriktionen? Und wie ist um den Datenschutz bei Grok3 bestellt?

๐˜žรค๐˜ฉ๐˜ณ๐˜ฆ๐˜ฏ๐˜ฅ ๐˜ฅ๐˜ช๐˜ฆ ๐˜œ๐˜š๐˜ˆ ๐˜ถ๐˜ฏ๐˜ฅ ๐˜Š๐˜ฉ๐˜ช๐˜ฏ๐˜ข ๐˜ช๐˜ฏ ๐˜ฅ๐˜ข๐˜ด ๐˜จ๐˜ฐ๐˜ญ๐˜ฅ๐˜ฆ๐˜ฏ๐˜ฆ ๐˜ก๐˜ฆ๐˜ช๐˜ต๐˜ข๐˜ญ๐˜ต๐˜ฆ๐˜ณ ๐˜ฅ๐˜ฆ๐˜ณ ๐˜’๐˜ ๐˜ถ๐˜ฏ๐˜ฅ ๐˜™๐˜ฐ๐˜ฃ๐˜ฐ๐˜ต๐˜ช๐˜ฌ ๐˜ฆ๐˜ช๐˜ฏ๐˜ต๐˜ณ๐˜ฆ๐˜ต๐˜ฆ๐˜ฏ, ๐˜ฉรค๐˜ญ๐˜ต ๐˜ฅ๐˜ช๐˜ฆ ๐˜Œ๐˜œ ๐˜ต๐˜ณ๐˜ฐ๐˜ต๐˜ป๐˜ช๐˜จ ๐˜ข๐˜ฏ ๐˜ช๐˜ฉ๐˜ณ๐˜ฆ๐˜ฎ ๐˜ถ๐˜ฎ๐˜ด๐˜ต๐˜ณ๐˜ช๐˜ต๐˜ต๐˜ฆ๐˜ฏ๐˜ฆ๐˜ฏ ๐˜Œ๐˜œ-๐˜’๐˜-๐˜ˆ๐˜ค๐˜ต ๐˜ง๐˜ฆ๐˜ด๐˜ต.

Quelle Images: X (ehemals Twitter)


๐Ÿ”ฅ Bleib am Puls der Zeit – alle News, Fakten und was du wissen solltest, hier auf meinem Blog oder Wegsite!

๐Ÿ”ฅStay curious - all the latest news, insights ahd must know facts, right here on my Blog or Website!


Hashtag

__________________________________________



©Text & Image: Stefan Trauth 2024; Image partially created with AI.

Excellence in Finance - Accounting - Digitalization - Visionary AI Architect | Pi(ฯ€) guides our way | Innovation Leader in Bi-Directional Hypnosis & Founder: Hypnotheris®: Inspire, Lead, Innovate

Keine Kommentare:

Kommentar verรถffentlichen

Mein Geburtstag: 48 Jahre – Zwischen Mensch, KI und (รœber)Leben

  Gestern blickte ich auf 48 Jahre zurรผck, die geprรคgt waren von Neugier, eigenem Kopf und dem Willen, Grenzen neu zu definieren. Das Leben ...