Zadebiutował Claude 3.7 Sonnet. Nowy model myśli inaczej od konkurencji

Zaprezentowano Claude 3.7 Sonnet, czyli kolejną wersję modelu językowego, która nie tylko charakteryzuje się lepszymi wynikami od poprzednika, ale też i sposobem podejścia do rozwiązywania problemów. Antrophic zdecydowało się bowiem na to, by wprowadzić ujednolicenie w sposobie działania modelu, co jest pierwszym takim przypadkiem w historii firmy. Debiutuje Claude 3.7 Sonnet Bezpośredni następca 3.5 Sonnet, […] Artykuł Zadebiutował Claude 3.7 Sonnet. Nowy model myśli inaczej od konkurencji pochodzi z serwisu ANDROID.COM.PL - społeczność entuzjastów technologii.

Lut 25, 2025 - 13:35
 0
Zadebiutował Claude 3.7 Sonnet. Nowy model myśli inaczej od konkurencji
Ikona aplikacji Claude na ekranie smartfona, obok klawiatury z widocznym klawiszem "A".

Zaprezentowano Claude 3.7 Sonnet, czyli kolejną wersję modelu językowego, która nie tylko charakteryzuje się lepszymi wynikami od poprzednika, ale też i sposobem podejścia do rozwiązywania problemów. Antrophic zdecydowało się bowiem na to, by wprowadzić ujednolicenie w sposobie działania modelu, co jest pierwszym takim przypadkiem w historii firmy.

Debiutuje Claude 3.7 Sonnet

Bezpośredni następca 3.5 Sonnet, ale też poniekąd modelu 3.5 Haiku, przynosi dużą zmianę. Po raz pierwszy bowiem użytkownicy będą mogli decydować w ramach jednego modelu, jak ten ma podchodzi do udzielania odpowiedzi na pytania.

3.7 Sonnet może bowiem działać jak klasyczny LLM i udzielać szybko, krótkich odpowiedzi na zadane pytanie, ale też można włączyć mu myślenie analityczne. W podstawowej wersji jest więc po prostu ulepszeniem poprzedniego modelu, a z możliwością rozszerzonych odpowiedzi, da się obserwować jego proces myślenia.

Tym samym jest też dokładniejszy i bardziej skupiony, a przed samym udzieleniem odpowiedzi, dokonuje też autorefleksji. To sprawiło, że model lepiej ma radzić sobie z zadaniami matematycznymi, fizyką czy tymi związanymi z programowaniem.

Tabela porównawcza wyników różnych modeli AI, takich jak Claude 3.7 Sonnet, Claude 3.5 Sonnet, OpenAI, DeepSeek R1, i Grok 3 Beta, w różnych kategoriach zadań takich jak "Graduate-level reasoning," "Agentic coding," "Multilingual Q&A," "Visual reasoning," "Instruction-following," "Math problem-solving," i "High school math competition." Każdy model ma swoje wyniki procentowe w różnych zadaniach, przy dodatkowych uwagach na temat specjalnych warunków dla niektórych testów i metodologii użytych w badaniach."
Fot. Anthropic / materiały prasowe

Anthropic skupiło się także na tym, by nowa wersja LLM-a skupiała się na rozwiązaniach i problemach bardziej życiowych, niż stricte matematycznych. Związane jest to z tym, jak firmy podchodzą do zastosowania modelu w codziennej pracy.

W wynikach Claude 3.7 Sonnet radzi sobie porównywalnie do o1 od OpenAI jeżeli chodzi o kwestie związane z rozwiązywaniem problemów natury matematycznej.

Zaprezentowano także Claude Code, które dostępne jest obecnie tylko dla ograniczonej grupy testerów i jest narzędziem działającym bezpośrednio w trakcie kodowania. Agent może przeglądać kod, edytować pliki czy uruchamiać testy, a nawet przesyłać kod bezpośrednio do GitHub. Z czasem ta funkcjonalność ma zostać udostępniona szerzej.

Źródło: Anthropic. Zdjęcie otwierające: Tada Images / Shutterstock

Część odnośników to linki afiliacyjne lub linki do ofert naszych partnerów. Po kliknięciu możesz zapoznać się z ceną i dostępnością wybranego przez nas produktu – nie ponosisz żadnych kosztów, a jednocześnie wspierasz niezależność zespołu redakcyjnego.

Artykuł Zadebiutował Claude 3.7 Sonnet. Nowy model myśli inaczej od konkurencji pochodzi z serwisu ANDROID.COM.PL - społeczność entuzjastów technologii.