Elon Musks Unternehmen x.AI hat heute sein neuestes Modell Grok 3 verรถffentlicht.
Die neuesten Testergebnisse zeigen, dass Grok 3 in vielen Disziplinen fรผhrend ist und seine Konkurrenz in mehreren Kategorien รผbertrifft.
Grok 3 in den Benchmarks
Laut den aktuellen Daten, die von X stammen, hat Grok 3 seine Konkurrenten in mehreren standardisierten Tests รผbertroffen, darunter:
Mathematik (AIME’24 Benchmark): Grok 3 erreichte eine Punktzahl von 52. Ein direkter Vergleich mit OpenAIs o1 oder o3 sowie anderen Reasoning-Modellen wรคre hier aussagekrรคftiger als mit GPT-4o.
๐ช๐ถ๐๐๐ฒ๐ป๐๐ฐ๐ต๐ฎ๐ณ๐ (๐๐ฃ๐ค๐ ๐๐ฒ๐ป๐ฐ๐ต๐บ๐ฎ๐ฟ๐ธ): Grok 3 dominierte mit 75 Punkten, gefolgt von DeepSeek-V3 mit 65 Punkten.
๐๐ผ๐ฑ๐ถ๐ฒ๐ฟ๐๐ป๐ด (๐๐๐ ๐๐ฒ๐ป๐ฐ๐ต๐บ๐ฎ๐ฟ๐ธ, ๐ข๐ธ๐.–๐๐ฒ๐ฏ.): Grok 3 erzielte einen Wert von 57 und รผbertraf damit Gemini-2 Pro sowie andere KI-Modelle deutlich.
๐๐ต๐ฎ๐๐ฏ๐ผ๐ ๐๐ฟ๐ฒ๐ป๐ฎ: Grok 3 dominiert
In der Chatbot Arena (LMSYS) zeigt sich ebenfalls die Stรคrke von Grok 3. Die "Chocolate"-Version des Modells fรผhrt die Rangliste mit einer beeindruckenden ELO-Wertung von fast 1400 Punkten an und schlรคgt damit Modelle wie DeepSeek-V3, Gemini 2.0, Claude 3.5 und OpenAIs o1.
๐๐๐ ๐ ๐ฎ๐ฌ๐ฎ๐ฑ: Grok 3 mit geringem Abstand an der Spitze
Ein weiteres Highlight ist die AIME 2025 Performance, bei der Grok 3 erneut herausragt:
Grok 3 Reasoning Beta: 93 Punkte
Grok 3 Mini Reasoning: 90 Punkte
o3mini (high): 87 Punkte
o1 (OpenAI): 79 Punkte
Was macht Grok 3 so besonders?
๐๐ฒ๐ถ๐๐๐๐ป๐ด๐๐ณรค๐ต๐ถ๐ด๐ฒ ๐๐ฟ๐ฐ๐ต๐ถ๐๐ฒ๐ธ๐๐๐ฟ: Grok 3 wurde auf dem Colossus Supercomputer mit 200.000 NVIDIA H100 GPUs trainiert und bietet eine erhebliche Rechenleistung.
๐๐ผ๐ธ๐๐ ๐ฎ๐๐ณ ๐ฅ๐ฒ๐ฎ๐๐ผ๐ป๐ถ๐ป๐ด & ๐ฃ๐ฟ๐ผ๐ฏ๐น๐ฒ๐บ๐นรถ๐๐๐ป๐ด: Das Modell zeigt solide Ergebnisse in Mathematik und Wissenschaft durch verbesserte logische Schlussfolgerungen.
๐๐ณ๐ณ๐ถ๐๐ถ๐ฒ๐ป๐๐ฒ ๐ฉ๐ฒ๐ฟ๐ฎ๐ฟ๐ฏ๐ฒ๐ถ๐๐๐ป๐ด: Grok 3 bearbeitet Anfragen schneller als sein Vorgรคnger und liefert prรคzisere Antworten.
Vergleich mit OpenAI-Modellen: Wรคhrend o1 und o3 von OpenAI in vielen Bereichen stark sind, zeigt sich Grok 3 in bestimmten Disziplinen รผberlegen.
Fazit: Wie wird OpenAI reagieren?
Die kommenden Monate werden zeigen, wie sich das Modell in der Praxis bewรคhrt und ob OpenAI sowie andere Marktfรผhrer mit ihren kommenden Generationen eine Antwort darauf finden.
Schickt Sam Altman nun GPT-4.5 ins Rennen oder gleich GPT-5 aka Orion als wohl erste AGI? Es bleibt spannend, und wie reagieren die anderen Teilnehmer, ebenfalls mit neuen Modellen und weniger Restriktionen? Und wie ist um den Datenschutz bei Grok3 bestellt?
๐รค๐ฉ๐ณ๐ฆ๐ฏ๐ฅ ๐ฅ๐ช๐ฆ ๐๐๐ ๐ถ๐ฏ๐ฅ ๐๐ฉ๐ช๐ฏ๐ข ๐ช๐ฏ ๐ฅ๐ข๐ด ๐จ๐ฐ๐ญ๐ฅ๐ฆ๐ฏ๐ฆ ๐ก๐ฆ๐ช๐ต๐ข๐ญ๐ต๐ฆ๐ณ ๐ฅ๐ฆ๐ณ ๐๐ ๐ถ๐ฏ๐ฅ ๐๐ฐ๐ฃ๐ฐ๐ต๐ช๐ฌ ๐ฆ๐ช๐ฏ๐ต๐ณ๐ฆ๐ต๐ฆ๐ฏ, ๐ฉรค๐ญ๐ต ๐ฅ๐ช๐ฆ ๐๐ ๐ต๐ณ๐ฐ๐ต๐ป๐ช๐จ ๐ข๐ฏ ๐ช๐ฉ๐ณ๐ฆ๐ฎ ๐ถ๐ฎ๐ด๐ต๐ณ๐ช๐ต๐ต๐ฆ๐ฏ๐ฆ๐ฏ ๐๐-๐๐-๐๐ค๐ต ๐ง๐ฆ๐ด๐ต.
Quelle Images: X (ehemals Twitter)
๐ฅ Bleib am Puls der Zeit – alle News, Fakten und was du wissen solltest, hier auf meinem Blog oder Wegsite!
๐ฅStay curious - all the latest news, insights ahd must know facts, right here on my Blog or Website!
__________________________________________
Keine Kommentare:
Kommentar verรถffentlichen