Οι κινεζικές εταιρείες τεχνητής νοημοσύνης φαίνεται να αποκτούν προβάδισμα έναντι των αμερικανικών ανταγωνιστών τους στον ταχέως αναπτυσσόμενο τομέα της δημιουργίας βίντεο μέσω AI, έναν κλάδο που εξελίσσεται σε κρίσιμο πεδίο ανταγωνισμού για τη generative AI.
Σύμφωνα με δημιουργούς περιεχομένου, προγραμματιστές και ανεξάρτητες πλατφόρμες αξιολόγησης μοντέλων, κινεζικά συστήματα όπως το Kling της Kuaishou, το Seedance 2.0 της ByteDance και το Hailuo της MiniMax εμφανίζουν καλύτερες επιδόσεις στην παραγωγή βίντεο σε σχέση με αντίστοιχα εργαλεία αμερικανικών εταιρειών.
Η εξέλιξη αυτή αποτυπώνει μια διαφοροποίηση στην παγκόσμια κούρσα της τεχνητής νοημοσύνης. Ενώ εταιρείες όπως η OpenAI, η Google και η Anthropic εξακολουθούν να κυριαρχούν στα μεγάλα γλωσσικά μοντέλα και σε τομείς όπως ο προγραμματισμός, οι κινεζικές πλατφόρμες φαίνεται να προηγούνται στην παραγωγή βίντεο τόσο σε ποιότητα όσο και σε λειτουργικότητα.
Το μεγάλο πλεονέκτημα των κινεζικών εταιρειών ΑΙ
Αναλυτές αποδίδουν το πλεονέκτημα αυτό στην τεράστια ποσότητα βιντεοληπτικού υλικού που διαθέτουν κινεζικοί τεχνολογικοί όμιλοι μέσω εφαρμογών σύντομων βίντεο όπως το TikTok και οι αντίστοιχες κινεζικές πλατφόρμες.
Η εκπαίδευση μοντέλων δημιουργίας βίντεο απαιτεί πολύ μεγαλύτερο όγκο δεδομένων σε σχέση με τα γλωσσικά μοντέλα κειμένου, ενώ η πρόσβαση σε μεγάλες βιβλιοθήκες οπτικού περιεχομένου θεωρείται κρίσιμο ανταγωνιστικό πλεονέκτημα.
Ο Μπεν Τσιάνγκ, ιδρυτής της startup Director AI που παράγει κινούμενα σχέδια και σύντομα δράματα μέσω AI, δήλωσε ότι τα περισσότερα αμερικανικά μοντέλα που δοκίμασε «δεν είναι ιδιαίτερα καλά στην παραγωγή βίντεο».
Όπως ανέφερε, η εταιρεία του χρησιμοποιεί κυρίως το Kling της Kuaishou, αλλά και τα μοντέλα της ByteDance και της MiniMax, ανάλογα με το κόστος και το είδος του περιεχομένου.
«Το βασικό είναι η ποιότητα και το πόσο σωστά ακολουθεί το μοντέλο τις οδηγίες του χρήστη», σημείωσε.
Για πολλούς δημιουργούς ψηφιακού περιεχομένου, οι πρόσφατες βελτιώσεις στα κινεζικά μοντέλα αλλάζουν ήδη τον τρόπο παραγωγής βίντεο, καθώς τα εργαλεία εμφανίζονται πιο σταθερά σε σκηνές με γρήγορη κίνηση, σύνθετες γωνίες λήψης και συγχρονισμό ήχου.
Ο ανεξάρτητος δημιουργός ταινιών AI Τζορτζ Γουόν δήλωσε ότι το Seedance 2.0 της ByteDance του προσφέρει «πολύ μεγαλύτερη δημιουργική ελευθερία», ειδικά σε σκηνές με έντονη κίνηση κάμερας.
«Τα περισσότερα μοντέλα αρχίζουν να χάνουν τη συνοχή της εικόνας όταν η σκηνή γίνεται γρήγορη ή περίπλοκη», ανέφερε.
«Περιοριστικά» χαρακτηρίζονται τα αμερικανικά AI μοντέλα
Τα μοντέλα Kling, Seedance 2.0 και HappyHorse 1.0 συγκαταλέγονται πλέον στις υψηλότερες θέσεις ανεξάρτητων rankings για εργαλεία παραγωγής βίντεο μέσω AI. Αντίστοιχα, το Veo 3 της Google θεωρείται από τα ελάχιστα αμερικανικά μοντέλα που παραμένουν ανταγωνιστικά, κυρίως λόγω της πρόσβασης της Google στη μεγάλη βιβλιοθήκη βίντεο του YouTube.
Ωστόσο, αρκετοί προγραμματιστές υποστηρίζουν ότι τα αμερικανικά εργαλεία είναι πολύ πιο περιοριστικά ως προς το περιεχόμενο που επιτρέπουν.
Ο Μπεν Τσιάνγκ ανέφερε ότι τα αμερικανικά μοντέλα «μπλοκάρουν συνεχώς αιτήματα» επικαλούμενα παραβιάσεις όρων χρήσης χωρίς να δίνουν σαφείς εξηγήσεις, γεγονός που δυσκολεύει σημαντικά τη δημιουργική διαδικασία.
Παράλληλα, η ταχεία ανάπτυξη των κινεζικών εργαλείων έχει προκαλέσει και νομικές αντιδράσεις. Η ByteDance έχει δεχθεί απειλές για προσφυγές σχετικά με πιθανές παραβιάσεις πνευματικών δικαιωμάτων, καθώς χρήστες δημιούργησαν βίντεο με χαρακτήρες από ταινίες της Marvel και τη σειρά South Park χωρίς σχετική άδεια.
Η εταιρεία έχει δηλώσει ότι θα ενισχύσει τα μέτρα προστασίας πνευματικών δικαιωμάτων στις πλατφόρμες της.
Με πληροφορίες από Financial Times















