Nový test FrontierMath AI nezvládá

Doporučujeme: Nastavte si sledování zajímavých článků a podcastů podle toho, co Vás zajímá. Nastavit

Datum publikování: 15. 11. 2024

V červenci jsme informovali, že umělá inteligence Google si celkem dobře vedla v Mezinárodní matematické olympiádě. Například v testu GSM-8k dosahují LLM běžně 96% úspěšnosti. Společnost EpochAI vyvinula nový matematický test pro AI s názvem FrontierMath na který jsou současné LLM krátké. Claude a Gemini vyřešily jen 2 % úkolů, o1 a GPT jen 1 %.

Přečíst celý článek na Root.cz - Zprávičky

Upoutávka na článek je uveřejněna se svolením Root.cz - Zprávičky. Celý článek si můžete přečíst zde.

Související témata

AI test umělá inteligence agent AI AI investice AI projekty AI průmysl AI sabotáž AI strategie generativní AI

Doporučené články

Od 3DMarku přichází test AI výkonu grafik. Ale pro velký byznys, ne pro hobby uživatele (Cnews.cz, 28. 3. 2024)
Služba hCaptcha chce po uživatelích identifikovat neexistující objekty (Root.cz - Zprávičky, 26. 5. 2023)
Google spustil veřejný test své konverzační AI Bard (Lupa.cz, 21. 3. 2023)
Praha kvůli uprchlíkům nezvládá udržet sociální služby (Zdravezpravy.cz, 28. 3. 2022)
Aiťákův týden: Kdo dostane Android 15, jak nainstalovat Python, OSA chce peníze ze smartphonů. Test levné myši z Lidlu (Živě.cz, 14. 12. 2024)
Procesory AMD s jádry Zen 5 razí do levnějších notebooků. V lednu vyjdou 8jádra a 6jádra (Cnews.cz, 13. 12. 2024)
Vettel podle Bergera nezvládá tlak ve formuli 1 (F1sport.cz, 5. 4. 2021)
Zátěžový test AI chatbotů. Jak rozumí obrázkům, škrabopisu a dokážou vytvořit malware budoucnosti? (Živě.cz, 17. 10. 2023)
Aiťákův týden: Test prvního Copilot+PC, Nvidia přeskočila Apple i Microsoft, alternativy k Total Commanderu (Živě.cz, 22. 6. 2024)

Nejnovější články

Linus Torvalds zasáhl do diskuse o Rustu v jádře (21. 2. 2025)
Gentoo má oficiální QCOW2 obrazy pro x86_64 a AArch64 (21. 2. 2025)
Meta se brání, že sice knížky stáhla, ale dále nesdílela, takže to není ilegální (21. 2. 2025)
Spotřebovává tmavý vzhled více energie? (21. 2. 2025)
Po týdenním odkladu vyšlo Ubuntu 24.04.2 LTS (21. 2. 2025)

Zobrazit poslední články na Root.cz - Zprávičky