29.5 C
Athens
Παρασκευή, 22 Σεπτεμβρίου, 2023

Καινούργια AI τεχνολογία μπορεί να φτιάξει 3D περιβάλλοντα από αντανακλάσεις ματιών!

Οι ερευνητές χρησιμοποίησαν λεπτές αντανακλάσεις φωτός που καταγράφηκαν στα ανθρώπινα μάτια για να προσπαθήσουν να διακρίνουν το άμεσο περιβάλλον του ατόμου

Χρόνος ανάγνωσης ⏰ 2 λεπτά

Ερευνητές του Πανεπιστημίου του Μέριλαντ δημιούργησαν ένα απίστευτο σύστημα τεχνητής νοημοσύνης (AI) που μπορεί να ανακατασκευάσει τρισδιάστατα περιβάλλοντα αναλύοντας τις αντανακλάσεις που καταγράφονται στα ανθρώπινα μάτια. Η τεχνολογία αυτή βασίζεται στο Neural Radiance Fields (NeRF), μια τεχνολογία AI που μπορεί να ανακατασκευάσει περιβάλλοντα από φωτογραφίες 2D.

Οι ερευνητές χρησιμοποίησαν λεπτές αντανακλάσεις φωτός που καταγράφηκαν στα ανθρώπινα μάτια για να προσπαθήσουν να διακρίνουν το άμεσο περιβάλλον του ατόμου. Για να το πετύχουν αυτό χρησιμοποίησαν πολλές εικόνες υψηλής ανάλυσης από μια σταθερή θέση κάμερας, απαθανατίζοντας ένα κινούμενο άτομο που κοιτάζει προς την κάμερα. Στη συνέχεια, μεγέθυναν τις αντανακλάσεις απομονώνοντάς τις, ενώ υπολόγισαν παράλληλα το που κοιτούσαν τα μάτια στις φωτογραφίες.

Τα δεδομένα αυτά χρησιμοποιήθηκαν για την εκπαίδευση μιας τροποποιημένης έκδοσης του NeRF, ειδικά προσαρμοσμένης για την ανακατασκευή σκηνών με τη χρήση των αντανακλάσεων των ματιών.

Σύμφωνα με τα αποτελέσματα που δημοσιεύθηκαν, η τεχνολογία έχει πράγματι τη δυνατότητα να παράγει λογικές τρισδιάστατες αναπαραστάσεις απλών σκηνών, όπως ένα τραπέζι με μια λάμπα και ένα βιβλίο ή ένα άτομο που κρατάει ένα παιχνίδι. Παρόλο που οι ανακατασκευές εμφανίζονταν θολές και με αρκετό θόρυβο λόγω της χαμηλής ανάλυσης και της παραμόρφωσης των αντανακλάσεων των ματιών, εξακολουθούσαν να είναι αναγνωρίσιμες και να συνάδουν με τις πραγματικές σκηνές.

Από την άλλη, οι ερευνητές επιχείρησαν να εφαρμόσουν την τεχνολογία τους και σε σενάρια του πραγματικού κόσμου, αναλύοντας βίντεο κλιπ με τη Miley Cyrus και την Lady Gaga, χωρίς όμως να επιτύχουν τα επιθυμητά αποτελέσματα αυτή τη φορά. Ειδικότερα, σε αυτή την περίπτωση αντιμετώπισαν μεγάλες προκλήσεις λόγω της χαμηλής ποιότητας και της μεταβλητότητας των αντανακλάσεων των ματιών σε αυτά τα βίντεο. Ήταν σε θέση να διακρίνουν μόνο ασαφή σχήματα, όπως ένα πλέγμα LED ή ένα τρίποδο κάμερας.

Οι ερευνητές ανέφεραν χαρακτηριστικά, «Με αυτό το έργο, ελπίζουμε να εμπνεύσουμε μελλοντικές εξερευνήσεις που αξιοποιούν απροσδόκητα, τυχαία οπτικά σήματα για να αποκαλύψουν πληροφορίες για τον κόσμο γύρω μας, διευρύνοντας τους ορίζοντες της ανακατασκευής 3D σκηνής».

NewsDesk
NewsDesk
Ειδησεογραφία γύρω από την τεχνολογία, από την ομάδα του tecky

ΠΡΟΣΦΑΤΑ

SOFTONE & Global Sustain μαζί για την δημιουργία e-platforms για business ESG

Ο Όμιλος Εταιρειών SOFTONE, πάροχος cloud-based business λύσεων, ανακοινώνει στρατηγική επένδυση στην Global Sustain, εταιρεία συμβουλευτικών υπηρεσιών και λύσεων στο χώρο του ESG. Μέσα...