Zrozumienie danych w narzędziu AI Vision Utility w VEXcode V5

NarzędzieAI Vision Utility umożliwia podłączenie i konfigurację czujnikaAI Vision. Aby dowiedzieć się, jak to zrobić, możesz przeczytać te artykuły tutaj:

Zrozumienie sposobu, w jaki czujnik wizyjny AI wykrywa i mierzy obiekty, może pomóc w lepszym wykorzystaniu tych pomiarów w projektach kodowania. Dzięki tej wiedzy możesz poprawić swoje umiejętności kodowania i tworzyć dokładniejsze rozwiązania dla zadań takich jak rozpoznawanie obiektów i analiza przestrzenna.

Zrozumienie odcienia i nasycenia

korekty kolorów.png

Podczas konfigurowania sygnatury kolorów wyświetlane są opcje dotyczące odcienia i nasycenia. Umożliwiają one dostrojenie sygnatury kolorystycznej, aby była bardziej odporna. Sygnatura koloru jest uważana za trwałą, gdy obiekt można przesuwać i nadal można go śledzić za pomocą narzędzia AI Vision Utility.

vex-rainbow-circle-graphic_2.jpg

Pierwszy suwak to zakres odcienia . Odcień to kolor, który postrzegamy, zgodnie z jego położeniem na kole barw. Zakres koła kolorów wynosi od 0 do 359,9 stopni, a każdy kolor na kole ma określoną wartość stopnia. 

Zakres odcienia umożliwia wybranie stopni powyżej i poniżej skonfigurowanego koloru, które będą wyświetlane jako ten kolor. Na przykład, ciemnoniebieski może mieć wartość odcienia 240 stopni. Przy zakresie odcienia równym 20 stopni, wszystko od 220 do 260 stopni będzie wyświetlane jako kolor skonfigurowany jako ciemnoniebieski.

saturation@2x.png

Drugi suwak to zakres nasycenia . Nasycenie to intensywność i czystość koloru. Im jaśniejszy kolor, tym bardziej nasycony. Nasycenie to skala względna mierzona w procentach, gdzie 0% oznacza stonowany odcień szarości, a 100% oznacza intensywną wersję tego odcienia. 

Zakres nasycenia umożliwia wybranie procentu nasycenia powyżej i poniżej skonfigurowanego koloru, który będzie wyświetlany jako ten kolor. Na przykład, czerwona kula przy przyciemnionym oświetleniu może wyglądać jak 50% nasycenia. Przy zakresie nasycenia równym 0,25 (dziesiętny odpowiednik 25%), wszystko od 25% do 75% nasycenia będzie zgłaszane jako skonfigurowany kolor czerwony.

Zrozumienie pikseli i rozdzielczości

grid-doodle-house.png

Wyobraź sobie, że rysujesz obrazek na kartce papieru w kratkę. Każdy malutki kwadracik na papierze jest jak piksel . Kolorując te kwadraty, tworzysz swój obrazek.

Niska rozdzielczość Wysoka rozdzielczość

Porozmawiajmy teraz o rozdzielczości . Rozdzielczość to liczba pikseli w obrazie. Jeśli na papierze w kratkę znajduje się dużo małych kwadracików (pikseli), zdjęcie będzie ostre i szczegółowe. Jeśli jednak masz tylko kilka pikseli , Twoje zdjęcie może być rozmazane i mało wyraźne.

Czujnik AI Vision ma rozdzielczość 320 pikseli w poziomie i 240 pikseli w pionie. Oznacza to, że dokładny środek detekcji pokrywa się ze współrzędnymi 160 na osi X i 120 na osi Y.

W jaki sposób czujnik wizyjny AI mierzy obiekty?

Dane zgłaszane przez czujnik

Czujnik wizyjny AI zbiera dane na temat skonfigurowanych kolorów, AprilTags i klasyfikacji AI. Część tych danych jest wyświetlana w narzędziu AI Vision Utility i może być pomocna podczas planowania i tworzenia projektu VEXcode. 

Na zdjęciu widoczna jest niebieska piłka Buckyball otoczona białym kwadratowym konturem. W lewym górnym rogu znajduje się etykieta wskazująca, że jest to obiekt niebieski o współrzędnych X:176, Y:117 i wymiarach W:80, H:78. Czerwone strzałki podkreślają szerokość i wysokość obiektu.

Szerokość i wysokość

Jest to szerokość lub wysokość wykrytego obiektu w pikselach.

Pomiary szerokości i wysokości pomagają identyfikować różne obiekty. Na przykład Buckyball będzie miał większą wysokość niż Ring.

 

Niebieski Buckyball śledzony przez system komputerowy. Obiekt jest otoczony białym kwadratem, a wewnątrz niego znajduje się mniejszy czerwony kwadrat otaczający w środku biały krzyż. W lewym górnym rogu zdjęcia znajduje się etykieta informująca, że obiekt jest niebieski, ma współrzędne X:176, Y:117 i wymiary W:80, H:78.

CenterX i CenterY

Są to współrzędne środka wykrytego obiektu w pikselach.

Współrzędne CenterX i CenterY ułatwiają nawigację i pozycjonowanie. Czujnik AI Vision ma rozdzielczość 320 x 240 pikseli.

Kąt

Kąt jest właściwością dostępną wyłącznie dla kodów kolorów iAprilTags. Oznacza to, czy wykryty kod kolorulub AprilTag jest zorientowany inaczej.

 

Niebieski Buckyball śledzony przez system wizyjny. Obiekt jest otoczony białym konturem, a w jego środku znajduje się biały krzyż. Etykieta w lewym górnym rogu wskazuje, że obiekt ma kolor niebieski, a także współrzędne X:176, Y:117 i wymiary W:80, H:78. Mały czerwony kwadrat podświetla lewy górny róg obiektu.

OriginX i OriginY

OriginX i OriginY to współrzędne w lewym górnym rogu wykrytego obiektu w pikselach.

Współrzędne OriginX i OriginY ułatwiają nawigację i pozycjonowanie. Łącząc tę współrzędną z szerokością i wysokością obiektu, można określić rozmiar pola ograniczającego obiekt. Może to pomóc w śledzeniu ruchomych obiektów lub nawigowaniu pomiędzy obiektami.

 

Trzy kwadratowe karty z AprilTags śledzone przez system wizyjny. Każda karta jest oznaczona numerem identyfikacyjnym i powiązanymi danymi śledzenia. Karta po lewej stronie ma etykietę ID:0 i przedstawia współrzędne A:350°, X:110, Y:96, W:41, H:41. Środkowa karta oznaczona ID:3 ma współrzędne A:1°, X:187, Y:180, W:57, H:57. Karta po prawej stronie ma etykietę ID:9 i współrzędne A:3°, X:237, Y:89, W:38, H:38. Każda karta ma biały kontur, a system śledzi ich położenie i orientację.

Identyfikator tagu

Identyfikator tagu jest dostępny tylko dla . To jest numer ID określonego AprilTag.

Identyfikacja konkretnych AprilTags umożliwia selektywną nawigację. Możesz zaprogramować robota tak, aby poruszał się w kierunku określonych znaczników, ignorując inne. W ten sposób możesz wykorzystać je jako drogowskazy do automatycznej nawigacji.

Na zdjęciu widać cztery obiekty śledzone przez system wizyjny: dwie kule i dwa pierścienie. Czerwona piłka ma współrzędne X:122, Y:84, W:67, H:66 i wynik 99%. Niebieska kula ma X:228, Y:86, W:70, H:68 i wynik 99%. Zielony pierścień ma współrzędne X:109, Y:186, W:98, H:92 i wynik 99%. Czerwony pierścień jest oznaczony jako X:259, Y:187, W:89, H:91 i ma wynik 99%. Każdy obiekt jest obramowany na biało, co wskazuje na dokładność śledzenia.

Wynik

Właściwość wyniku jest używana w przypadku wykryciaklasyfikacji AI przez czujnik wizyjny AI.

Wynik pewności wskazuje, jak pewny jest czujnik AI Vision, że wykryje błąd. Na tym obrazku identyfikacja klasyfikacji AI tych czterech obiektów jest na poziomie 99% pewna. Za pomocą tego wyniku możesz mieć pewność, że Twój robot skupi się tylko na wykryciach o wysokiej pewności.

For more information, help, and tips, check out the many resources at VEX Professional Development Plus

Last Updated: