Juče (17. novembra 2025.) je xAI, kompanija Elona Muska, zvanično predstavila Grok 4.1 – najnoviju iteraciju svog flagship modela koja donosi revolucionarne poboljšanja u svakodnevnoj upotrebi. Ovaj put fokus nije samo na sirovoj inteligenciji, već na tome da Grok postane zaista prijatelj za razgovor: emotivniji, kreativniji, saradljiviji i – što je najvažnije – mnogo manje sklon halucinacijama.
Šta je novo u Grok 4.1?x
AI je iskoristio istu masovnu infrastrukturu za reinforcement learning (RL) kao i za Grok 4, ali ovaj put su je primenili da optimizuju stil, ličnost, korisnost i usklađenost modela. Rezultat?
Izuzetna emotivna inteligencija – Grok 4.1 bolje razume nijanse ljudskih namera, empatije, uvida i međuljudskih veština.
Kreativnost i saradnja – Savršen za kreativno pisanje, roleplay i duge, smislene razgovore.
Dosledna ličnost – Zadržava oštru inteligenciju i pouzdanost prethodnika, ali je mnogo prijatniji i koherentniji.
Drastično smanjene halucinacije – Na realnim informacionim upitima iz produkcije, stopa grešaka je pala za čak 65–70% (sa ~12% na ~4% na internim testovima, a na FActScore benchmarku sa ~10% na ~3%).
Dve varijante:
Grok 4.1 Thinking (kodno ime: quasarflux) – koristi „thinking tokens“ za duboko razmišljanje.
Grok 4.1 non-reasoning (kodno ime: tensor) – munjevito brz, bez razmišljanja u pozadini.
Benchmark rezultati – Grok 4.1 dominira
Grok 4.1 je odmah preuzeo vrh najvažnijih leaderboardova:
Benchmark | Varijanta | Pozicija | Elo skor | Napomena |
|---|---|---|---|---|
LMArena Text Arena | Grok 4.1 Thinking (quasarflux) | #1 | 1483 | +31 bod prednosti nad najboljim ne-xAI modelom |
LMArena Text Arena | Grok 4.1 non-reasoning (tensor) | #2 | 1465 | Bolji od svih konkurenata u punom reasoning modu |
Blind preference (realni saobraćaj) | Grok 4.1 vs prethodni model | – | 64,78% | Korisnici više vole novu verziju u 2/3 slučajeva |
EQ-Bench (emotivna inteligencija) | Grok 4.1 | U toku integracije | – | Izvanredni rezultati na 45 teških roleplay scenarija |
Creative Writing v3 | Grok 4.1 | U toku integracije | – | Najbolji do sada za kreativno pisanje |
(Ovo su podaci sa zvanične objave i LMArena leaderboarda na dan lansiranja – Grok 4 je pre samo par meseci bio na #33 mestu!)
Zašto je ovo važno?
U moru AI modela koji se takmiče u sirovoj snazi (matematika, kodiranje, logika), xAI je odlučio da Grok 4.1 bude najhumaniji AI. Manje „robot“, više „prijatelj koji razume“. To je upravo ono što mnogi od nas traže – AI sa kojim je zabavno razgovarati satima, a da ne morate da proveravate svaku činjenicu dvaput. Ako još niste, otvorite Grok odmah i probate neku emotivnu ili kreativnu temu – razlika je očigledna!
Šta vi mislite o novom Groku?
