Spoločnosť Toshiba Corporation vyvinula AI s rozpoznávaním 3D, ktorá je schopná merať vzdialenosť s presnosťou stereokamery pomocou obrazu nasnímaného komerčným fotoaparátom a pomocou hlbokého učenia analyzovaného rozmazania obrazu spôsobeného objektívom fotoaparátu. Táto technológia vylúči použitie stereokamery, čo nakoniec zníži náklady a priestor. Spoločnosť Toshiba predstaví tento úspech na medzinárodnej konferencii o počítačovom videní (ICCV2019), ktorá sa uskutoční v Južnej Kórei 30. októbra 2019 od 10. hodiny.
Snímanie obrazu je čoraz dôležitejšie a aplikácie, ako sú roboty pohybujúce sa v objektoch, autonómne bezpilotné vozidlá, diaľkovo ovládané drony kontrolujúce infraštruktúru atď., Vyžadujú viac ako len obrazy subjektov, potrebujú malé zariadenie na analýzu 3D údajov vrátane tvaru a vzdialenosti. Z tohto dôvodu boli rozšírené výskumy zamerané na vývoj meracej technológie s monokulárnymi kamerami (dajú sa ľahko miniaturizovať) pomocou hlbokého učenia pre lepšie spoznanie obrazca, pozadia a ďalších scenérií obrazového objektu.
Táto metóda má nevýhodu; presnosť vzdialenosti sa odhaduje pomocou monokulárnej kamery v závislosti od naučených údajov o scenérii, čo spôsobuje pokles presnosti v dôsledku snímok nasnímaných v rôznych krajinách. Aby to bolo možné prekonať, spoločnosť Toshiba vyvinula fotografiu clony s farebným filtrovaním, pri ktorej sú k objektívu pripevnené dva farebné filtre a farba a veľkosť výsledného rozmazania obrazu sú analyzované podľa vzdialenosti od objektu. Aj keď sa tým vyrieši problém so závislosťou na údajoch, úprava existujúcich šošoviek stojí čas a peniaze.
Spoločnosť Toshiba tento problém prekonala vývojom AI s technológiou rozpoznávania 3D, ktorá využíva hlboké učenie na analýzu toho, ako je obraz rozmazaný podľa jeho polohy na objektíve, aby bolo možné dosiahnuť meranie vzdialenosti s rovnako vysokou presnosťou ako stereokamera, s normálnym monokulárnym fotoaparátom, ale bez potreby údajov o scenérii. Doteraz sa považovalo za teoreticky nemožné merať vzdialenosť na základe tvaru rozmazania, ktorý je rovnaký pre objekty so vzdialenosťou aj ďaleko, keď sú v rovnakej vzdialenosti od ohniska. Analytické výsledky však ukázali podstatný rozdiel medzi tvarmi rozostrenia blízko a ďaleko od objektov, aj keď sú rovnako vzdialené od ohniska. Vďaka tomu spoločnosť Toshiba úspešne analyzovala údaje o rozmazaní zo zachytených obrázkov pomocou modulu hlbokého učenia trénovaného pomocou modelu hlbokej neurónovej siete.
Je známe, že pri prechode svetla šošovkou sa tvar vytvorenej rozmazanosti mení v závislosti od vlnovej dĺžky svetla a jeho polohy v šošovke. V rozvinutej sieti sa poloha a farba spracúvajú osobitne, aby správne vnímali zmeny tvaru rozmazania, a potom po prechode mechanizmom váženej pozornosti kontrolujú, kam na gradient jasu zamerať, aby bolo možné správne zmerať vzdialenosť. Prostredníctvom učenia sa sieť potom aktualizuje, aby sa znížila chyba medzi nameranou a skutočnou vzdialenosťou. Použitím tohto modulu AI spoločnosť Toshiba potvrdila, že jediný obraz nasnímaný komerčne dostupným fotoaparátom dosahuje rovnakú presnosť merania vzdialenosti zabezpečenú stereokamerami. Viac informácií nájdete na tejto oficiálnej stránke spoločnosti Toshiba.
Spoločnosť Toshiba potvrdí všestrannosť systému komerčne dostupnými fotoaparátmi a objektívmi a urýchli spracovanie obrazu s cieľom verejnej implementácie vo fiškálnom roku 2020.