De ce Tesla a renunțat la radar și LiDAR pentru a se concentra complet pe viziune
În lupta intensă pentru soluționarea conducerii autonome, s-a conturat o adâncă divergență filosofică și inginerească. Potrivit notateslaapp.com, Tesla mizează pe o soluție bazată exclusiv pe camere, îndepărtându-se de abordarea tradițională a fuzionării senzorilor, care combină camere, radar și LiDAR.
👉 Abordarea industriei auto versus decizia Tesla
În această competiție, majoritatea industriei auto și a sectorului tehnologic promovează conceptul de fuzionare a senzorilor, o abordare care combină mai multe tipuri de senzori pentru a crea o viziune redundantă și stratificată a mediului înconjurător. Însă, Tesla a ales să mizeze pe viziunea bazată exclusiv pe camere, o decizie controversată, dar derivată dintr-o convingere profundă privind natura inteligenței, atât artificiale cât și naturale.
Pentru a înțelege de ce Tesla a luat această decizie, este necesar să se cunoască exact ce a respins. Conceptul de fuzionare a senzorilor este relativ simplu. Acesta își propune să valorifice avantajele unice ale diferitelor tipuri de senzori pentru a crea un model robust al mediului din jurul unui vehicul. Fiecare tip de senzor are avantaje și dezavantaje, iar în teorie, fuzionarea lor reduce slăbiciunile fiecărui tip în parte.
Camerele oferă cele mai bogate date, având o rezoluție înaltă și percepând lumea în culori și texturi, similar cu modul în care o face un om. Ele pot citi textul de pe semne, pot identifica culoarea unui semafor și pot înțelege contexte vizuale complexe. Cu toate acestea, slăbiciunea principală a camerelor este că acestea pot fi afectate de condiții meteorologice nefavorabile și lumina slabă.
👉 Caracteristicile și limitările senzorilor radar și LiDAR
Radarul este excelent în a măsura distanța și viteza obiectelor, chiar și în condiții meteo dificile. El poate "vedea" prin ploaie, ceață și zăpadă, însă slăbiciunea sa constă în rezoluția mai scăzută. În mod matematic, ar fi necesar un aranjament radar de 3 metri pe 3 metri, costisitor, pentru a avea aceeași rezoluție ca o cameră într-o singură direcție.
LiDAR-ul funcționează similar cu radarul, dar utilizează lasere pentru a crea o hartă 3D a mediului. Este foarte precis în măsurarea distanței și formei, ceea ce îi permite să construiască un model 3D detaliat. Totuși, costul relativ mare al senzorilor și deteriorarea performanței în condiții meteo adverse constituie slăbiciunile sale principale.
Industria auto a adoptat, în general, abordarea fuzionării senzorilor, utilizată de companii precum Waymo și Cruise. Însă, Tesla nu a început cu o abordare bazată doar pe viziune. Sistemele timpurii Autopilot, cât timp au fost pe piață până în 2021, au fost echipate cu camere și un radar ukărăs care priveau înainte, furnizate de companii specializate în senzori auto, precum Bosch. Aceasta era o configurație convențională de fuzionare a senzorilor.
În 2021, Tesla a făcut o cotitură radicală, anunțând că va elimina radarul din noile modele 3 și Y și va trece la un sistem bazat exclusiv pe camere denumit Tesla Vision. Această decizie a fost determinată de o argumentație bazată pe principiile fundamentale de către Elon Musk, care vizau pericolele generate de datele senzoriale contradictorii. Musk a susținut că fuzionarea senzorilor reduce siguranța din cauza conflictelor între senzori.
Elon a declarat că ambiguitatea senzorilor creează un risc crescut, având în vedere că atunci când două sisteme de senzori oferă informații contradictorii, este nevoie să se stabilească care senzor este mai precis sau mai sigur. Această ambiguitate poate paraliza procesul decizional, mai ales în momentele în care siguranța este prioritară.
De asemenea, jurnaliștii au adus în discuție slăbiciunile fundamentale ale radarului, precum incapacitatea sa de a diferenția obiectele staționare, ceea ce a dus la evenimentele proaste de frânare fantomă întâmpinate de Tesla în trecut, unde o mașină putea confunda un pasaj de pietoni sau o cutie de aluminiu abandonată cu un vehicul oprit.
Perspectiva Tesla este că soluția generalizată pentru autonomia vehiculelor trebuie să rezolve problema viziunii. Oamenii conduc cu două camere biologice și o rețea neurală puternică. Partea principală a acestei strategii este că, dacă se reușește să se facă ca viziunea computerizată să funcționeze perfect, oricare alt senzor devine, în cel mai bun caz, o distragere, iar în cel mai rău caz, o sursă de ambiguitate periculoasă.
👉 Implementarea exclusivă a sistemului Tesla Vision
Astăzi, fiecare Tesla nou se bazează exclusiv pe Tesla Vision, susținut de cele opt camere ale sale. Sistemul utilizează o rețea neurală sofisticată pentru a crea o reprezentare vectorială 3D a lumii, pe care mașina o analizează și navighează. Atunci când Tesla a lansat Hardware 4 (acum AI4), noile modele S și X au fost echipate cu un radar de înaltă definiție, însă Tesla nu a activat niciodată aceste radare pentru utilizare în FSD.
Decizia Tesla de a renunța la fuzionarea senzorilor este cea mai mare diferență între abordarea sa în ceea ce privește autonomia și metodologiile restului industriei. Doi, Elon, Ashok și echipa Tesla AI cred că singura cale spre un sistem autonom scalabil și de uz general care să poată naviga prin lume cu inteligență asemănătoare omului este de a rezolva complet problema viziunii. Dacă au dreptate, vor crea un sistem care va fi mult mai ieftin și infinit mai scalabil decât vehiculele costisitoare, încărcate cu senzori, ale competitorilor.