Η Google κυκλοφόρησε το Gemini AI, επιτέλους έκανε τη μεγάλη κίνηση και αποκάλυψε μια νέα εποχή. Το Gemini είναι το πιο πρόσφατο large language model (LLM) της Google, το οποίο κυκλοφόρησε πρόσφατα στο κοινό μετά από ένα teaser τον Ιούνιο. Το Gemini είναι κατασκευασμένο για πολυτροπικότητα, ικανό να συλλογίζεται απρόσκοπτα σε κείμενο, εικόνες, βίντεο, ήχο και κώδικα. Αυτό το τεράστιο βήμα στην τεχνητή νοημοσύνη αναμένεται να έχει αντίκτυπο σε όλα τα προϊόντα της Google.
Το Gemini AI ειδικεύεται:
- Όραση υπολογιστή (ανίχνευση αντικειμένων, κατανόηση σκηνής και ανίχνευση ανωμαλιών)
- Γεωχωρική επιστήμη (συγχώνευση δεδομένων πολλαπλών πηγών, σχεδιασμός και ευφυΐα και συνεχής παρακολούθηση)
- Ανθρώπινη υγεία (εξατομικευμένη υγειονομική περίθαλψη, ενσωμάτωση βιοαισθητήρα και προληπτική ιατρική)
- Ολοκληρωμένες τεχνολογίες (domain knowledge transfer, συνχώνευση δεδομένων,ενισχυση της λήψη αποφάσεων and LLMs).
Το Gemini είναι το πρώτο μοντέλο που έχει ξεπεράσει σε απόδοση ακόμα και ανθρώπους που έχουν ισχυρό επιστημονικό υπόβαθρο στο MMLU (Massive Multitask Language Understanding). Αυτό λεει πολλά για τις δυνατότητες του Gemini εφόσον είναι μια από τις πιο χρησιμοποιούμενες μεθόδους, που δοκιμάζει τις γνώσεις και τις ικανότητες επίλυσης προβλημάτων των μοντέλων τεχνητής νοημοσύνης.
Το Gemini έχει τρεις εκδόσεις: Nano, Pro και Ultra, καθεμία από τις οποίες καλύπτει διαφορετικές ανάγκες των χρηστών:
- Gemini Nano είναι διαθέσιμο στο Pixel 8 Pro, με βελτιωμένες λειτουργίες όπως η περίληψη και η έξυπνη απάντηση στο Gboard.
- Gemini Pro είναι διαθέσιμο δωρεάν στο Google Bard και έχει προηγμένες δυνατότητες που βασίζονται σε κείμενο.
- Gemini Ultra αναμένεται να είναι η πιο ισχυρή έκδοση και θα είναι διαθέσιμο το επόμενο έτος.
Google Gemini στο Bard
Η ενσωμάτωση Gemini-Bard συνοδεύεται από μια σημαντική βελτίωση που επιτρέπει στο Bard να παράγει πιο ακριβείς, υψηλής ποιότητας απαντήσεις κατανοώντας καλύτερα την πρόθεση του χρήστη. Επιπλέον, το Gemini επιτρέπει στο Bard να χειρίζεται απρόσκοπτα όλα τα είδη μέσων, δηλαδή εικόνες, ήχο και βίντεο, βελτιώνοντας την εμπειρία του χρήστη.
Η ενσωμάτωση του Gemini με το Bard θέτει τα θεμέλια για ένα μέλλον πλούσιας και διαφοροποιημένης αλληλεπίδρασης του ανθρώπου με την τεχνητή νοημοσύνη. Για να χρησιμοποιήσετε το Gemini Pro, επισκεφθείτε τον ιστότοπο του Bard και συνδεθείτε με τον προσωπικό σας λογαριασμό Google. Αφού συνδεθείτε, μπορείτε να απολαύσετε τις προηγμένες λειτουργίες του Gemini Pro μέσα στο chatbot Bard ρωτώντας ή λέγοντας οτιδήποτε στο Bard.
Το Bard δεν έφτανε ακριβώς τις δυνατότητες του ChatGPT της OpenAI, αυτό όμως άλλαξε με την κυκλοφορία του Gemini, το οποίο εισήγαγε πιο προηγμένη συλλογιστική και κατανόηση. Σε ένα πολύ πρόσφατο whitepaper αναφέρεται ότι η πιο ικανή έκδοση του Gemini ξεπέρασε το GPT-4 σε εξετάσεις πολλαπλών επιλογών, μαθηματικά δημοτικού και άλλα κριτήρια αναφοράς.
Σήμερα, το Bard χρησιμοποιεί μόνο ένα μικρό μέρος των δυνατοτήτων του Gemini. Η πολυτροπική λειτουργία που δέχεται και δημιουργεί εικόνες, ήχο και βίντεο πρόκειται να ξεκινήσει το επόμενο έτος με τη νεότερη έκδοση του Bard που ονομάζεται Bard Advanced. Θα χρησιμοποιεί το Gemini Ultra, το οποίο είναι το πιο ισχυρό, το οποίο είναι η πιο ισχυρή και ικανή παραλλαγή του Gemini. Ακόμα το Gemini Ultra θα υποστηρίζει επίσης περισσότερες γλώσσες από την αγγλική, η οποία είναι επί του παρόντος η μόνη διαθέσιμη γλώσσα για το Gemini Pro.