Η Anthropic ανακοίνωσε το Claude Sonnet 5, τη νέα έκδοση του μεσαίου μοντέλου της, το οποίο τοποθετεί ως πιο ισχυρή και πιο «agentic» επιλογή για εργασίες που απαιτούν σχεδιασμό, χρήση εργαλείων και μεγαλύτερο βαθμό αυτονομίας.
Σύμφωνα με την εταιρεία, το Sonnet 5 μπορεί να αναλαμβάνει πιο σύνθετες εργασίες, να αξιοποιεί εργαλεία όπως browsers και terminals και να λειτουργεί με μεγαλύτερη αυτονομία σε σχέση με προηγούμενες γενιές μοντέλων.
Η κίνηση αυτή εντάσσεται σε μια ευρύτερη τάση της αγοράς, όπου οι μεγάλοι πάροχοι μοντέλων τεχνητής νοημοσύνης προσπαθούν να κάνουν τους AI agents πιο ικανούς, πιο αξιόπιστους και πιο οικονομικούς στη χρήση.
Το βασικό επιχείρημα της Anthropic είναι ότι το Claude Sonnet 5 πλησιάζει την απόδοση ακριβότερων μοντέλων, όπως το Opus 4.8, αλλά με χαμηλότερο κόστος. Το νέο μοντέλο έγινε η προεπιλογή για τα Free και Pro πακέτα του Claude και διατίθεται σε όλες τις συνδρομές.
Η αρχική τιμολόγηση ορίζεται στα 2 δολάρια ανά εκατομμύριο input tokens και 10 δολάρια ανά εκατομμύριο output tokens έως τις 31 Αυγούστου. Μετά από αυτή την ημερομηνία, η τιμή αυξάνεται στα 3 δολάρια για input tokens και 15 δολάρια για output tokens. Αυτό τοποθετεί το Sonnet 5 ως φθηνότερη επιλογή από ορισμένα κορυφαία μοντέλα της αγοράς, αν και όχι από όλα τα πιο ελαφριά μοντέλα ανταγωνιστών.
Η Anthropic υποστηρίζει επίσης ότι το Sonnet 5 εμφανίζει σημαντική βελτίωση σε σχέση με το Sonnet 4.6 σε ορισμένους τομείς όπως προγραμματισμός και εργασίες γνώσης. Σε benchmarks που αναφέρει η εταιρεία, το Sonnet 5 πλησιάζει το Opus 4.8 σε agentic coding, ενώ σε ορισμένες εργασίες γνώσης φέρεται να το ξεπερνά ελαφρώς.
Πέρα από την απόδοση, η Anthropic δίνει έμφαση και στην ασφάλεια. Το νέο μοντέλο φέρεται να παρουσιάζει χαμηλότερα ποσοστά ανεπιθύμητων συμπεριφορών, όπως συνεργασία σε κακόβουλη χρήση, παραπλάνηση, hallucinations και υπερβολικά συγκαταβατικές απαντήσεις, σε σύγκριση με τον προκάτοχό του.
Παρόλα αυτά, η Anthropic ξεκαθαρίζει ότι το Sonnet 5 δεν φτάνει το επίπεδο των ισχυρότερων μοντέλων της, όπως το Opus 4.8, σε ορισμένες κατηγορίες ασφάλειας και σύνθετης συμπεριφοράς. Η εταιρεία το παρουσιάζει περισσότερο ως μια ισορροπημένη επιλογή κόστους και απόδοσης για προγραμματιστές και επιχειρήσεις που θέλουν να τρέχουν agentic εφαρμογές σε κλίμακα.
Πηγή: techcrunch







