Le gare di droni in prima persona (FPV) sono uno spettacolo televisivo in cui piloti professionisti guidano velivoli ad alta velocità attraverso circuiti tridimensionali. Ogni pilota vede l’ambiente dalla prospettiva del proprio drone grazie a un video in streaming proveniente da una telecamera di bordo. Tuttavia, far gareggiare un drone autonomo a livello professionistico è una sfida impegnativa poiché il robot deve volare ai suoi limiti fisici mentre stima la sua velocità e posizione nel circuito esclusivamente dai sensori di bordo.

La nascita del drone Swift: Un sistema autonomo di classe mondiale

Ecco dove entra in gioco Swift, un sistema autonomo progettato per gareggiare con veicoli fisici al livello dei campioni mondiali umani. Questo sistema utilizza l’apprendimento profondo rinforzato (deep reinforcement learning) in simulazione e dati raccolti nel mondo reale. Swift ha sfidato tre campioni umani, compresi i campioni mondiali di due leghe internazionali, in gare di drone head-to-head nel mondo reale. Sorprendentemente, Swift ha vinto diverse gare contro ciascuno dei campioni umani e ha stabilito il tempo di gara più veloce mai registrato.

L’apprendimento profondo e le sue conquiste recenti

L’apprendimento profondo (Deep Learning) ha reso possibili alcune delle recenti applicazioni dell’intelligenza artificiale. Le policies addestrate con l’apprendimento profondo hanno superato gli esseri umani in giochi competitivi complessi come Atari, Go, scacchi, StarCraft, Dota 2 e Gran Turismo. Tuttavia, queste dimostrazioni si sono svolte principalmente in ambienti di simulazione e giochi da tavolo, che supportano la ricerca di policies in una replica esatta delle condizioni di test. Superare questa limitazione e dimostrare prestazioni di livello campione in competizioni fisiche è un problema di lunga data nella robotica mobile autonoma e nell’intelligenza artificiale.

Il mondo delle gare di droni FPV

Le gare di droni FPV sono uno sport televisivo in cui piloti altamente addestrati spingono i droni ai loro limiti fisici in manovre agili ad alta velocità. Durante una gara, i droni esercitano forze che superano il loro peso di un fattore 5 e superiori, raggiungendo velocità di oltre 100 km/h e accelerazioni diverse volte quella della gravità, anche in spazi ristretti. Ogni drone è controllato a distanza da un pilota umano che indossa un visore che mostra uno streaming video dalla telecamera di bordo, creando un’esperienza immersiva in prima persona.

La sfida delle gare di droni autonomi

Fin dal 2016, ci sono stati tentativi di creare sistemi autonomi in grado di competere con i piloti umani nelle gare di droni. Tuttavia, questi sistemi hanno avuto bisogno di innovazioni continue, come reti neurali profonde per identificare la posizione dei cancelli, il trasferimento delle policies di gara dalla simulazione alla realtà e la gestione dell’incertezza nella percezione. Nel 2019, la competizione di droni AlphaPilot ha messo in mostra alcune delle migliori ricerche in questo campo. Tuttavia, i primi due team impiegavano ancora quasi il doppio del tempo di un pilota umano professionista per completare il percorso. Solo di recente, i sistemi autonomi hanno iniziato a raggiungere le prestazioni di un pilota umano esperto. Tuttavia, questi lavori si basavano su stime dello stato quasi perfette fornite da un sistema di motion capture esterno, rendendo ingiusta la comparazione con i piloti umani che dispongono solo di osservazioni di bordo dal drone.

Il sistema Swift

Swift è un sistema autonomo che può gareggiare con un quadricottero (il tipo di drone utilizzato nelle gare FPV) al livello dei campioni mondiali umani utilizzando solo sensori di bordo e calcoli. Il sistema è composto da due moduli principali: un sistema di percezione che traduce informazioni visive e inerziali ad alta dimensionalità in una rappresentazione a bassa dimensionalità, e una policy di controllo che elabora la rappresentazione a bassa dimensionalità prodotta dal sistema di percezione e produce comandi di controllo.

La policy di controllo è rappresentata da una rete neurale feedforward ed è addestrata in simulazione utilizzando l’apprendimento profondo senza modello. Per superare le discrepanze tra la simulazione e il mondo fisico, Swift utilizza modelli di rumore empirico non parametrici stimati dai dati raccolti sul sistema fisico. Questi modelli empirici si sono rivelati fondamentali per il trasferimento di policies di controllo dalla simulazione alla realtà.

Le gare e i risultati

Swift è stato testato su una pista fisica progettata da un pilota di droni professionista. Ha gareggiato contro tre campioni umani di fama mondiale, tra cui il campione del mondo della Drone Racing League 2019, il campione del MultiGP International Open World Cup e il campione svizzero nazionale. I quadricotteri utilizzati da Swift e dai piloti umani avevano lo stesso peso, forma e propulsione, simili ai droni utilizzati nelle competizioni internazionali.

Dopo una settimana di pratica sulla pista, i piloti umani hanno gareggiato contro Swift in varie gare head-to-head. Swift ha vinto molte gare contro ciascun pilota umano e ha stabilito il tempo di gara più veloce mai registrato. Questo lavoro rappresenta la prima volta, a nostra conoscenza, che un robot mobile autonomo ha raggiunto le prestazioni di un campione mondiale in uno sport competitivo del mondo reale.

La tecnologia alla base di Swift

Swift utilizza una combinazione di algoritmi basati sull’apprendimento e algoritmi tradizionali per tradurre le letture dei sensori di bordo in comandi di controllo. Questa traduzione comprende due parti principali: una policy di osservazione che distilla le informazioni visive e inerziali ad alta dimensionalità in una codifica a bassa dimensionalità specifica per il compito, e una policy di controllo che trasforma la codifica in comandi per il drone. Inoltre, Swift utilizza modelli di rumore empirico per mitigare le discrepanze tra simulazione e realtà.

I risultati delle gare e le analisi

Nelle gare contro i campioni umani, Swift ha dimostrato una notevole competenza. Ha vinto la maggior parte delle gare contro ciascun pilota umano e ha registrato il tempo di gara più veloce. Sebbene Swift sia globalmente più veloce dei piloti umani, è interessante notare che non è necessariamente più veloce in tutti i segmenti della pista. Swift è particolarmente veloce all’inizio della gara e nelle curve strette, dove dimostra di essere più reattivo e capace di accelerare rapidamente.

Swift rappresenta un importante passo avanti nella robotica mobile e nell’intelligenza artificiale, dimostrando che è possibile raggiungere prestazioni di livello campione in competizioni fisiche con sistemi autonomi. L’uso dell’apprendimento profondo e dei modelli di rumore empirico ha permesso a Swift di superare le sfide legate alla simulazione e di competere con successo contro i campioni umani nelle gare di droni FPV. Questa innovazione apre la strada a soluzioni basate sull’apprendimento ibrido in altri sistemi fisici e rappresenta un punto di riferimento significativo nell’avanzamento della tecnologia autonoma.

Approfondimenti: Nature