Розуміння даних утиліти штучного інтелекту зору у VEXcode EXP

УтилітаAI Vision Utility дозволяє підключати та налаштовувати вашдатчик AI Vision Sensor. Щоб дізнатися, як це зробити, ви можете прочитати ці статті тут:

Розуміння того, як датчик зору зі штучним інтелектом виявляє та вимірює об'єкти, може допомогти вам краще використовувати ці вимірювання у ваших проектах кодування. Маючи ці знання, ви можете покращити свої навички програмування та створювати точніші рішення для таких завдань, як розпізнавання об'єктів та просторовий аналіз.

Розуміння відтінку та насиченості

Утиліта AI Vision з показаними параметрами кольорової сигнатури. Колірна сигнатура називається Синій та має значення Діапазону відтінку 32 та Діапазону насиченості 0,57.

Під час налаштування колірної сигнатури з’являються параметри як для діапазонів відтінку, так і для діапазонів насиченості. Це дозволяє налаштувати колірну сигнатуру, щоб вона була стійкою Колірна сигнатура вважається стійкою, коли об'єкт можна переміщувати, і утиліта штучного інтелекту зором все одно його відстежує.

Колірне коло, що демонструє, як коло на 360 градусів співвідноситься зі значенням відтінку. Червоний колір має градус 0, зелений колір — 120, а синій колір — 240.

Перший повзунок — це діапазон відтінків . Відтінок – це колір, що сприймається, що визначається його положенням на колірному колі. Це колірне коло має діапазон від 0 до 359,9 градусів, і кожен колір на колі має певне значення градуса. 

Діапазон відтінку дозволяє вибрати градуси вище та нижче налаштованого кольору, які будуть відображатися як цей колір. Наприклад, темно-синій колір може мати значення відтінку 240 градусів. З діапазоном відтінку 20 градусів, будь-який колір від 220 до 260 градусів буде відображатися як темно-синій налаштований колір.

Графік зростання значення насичення від 0% до 100%. Значення насиченості 0% – це сірий колір, а значення насиченості 100% – яскраво-червоний.

Другий повзунок — це Діапазон насиченості. Насиченість – це інтенсивність або чистота кольору. Чим яскравіший колір, тим він насиченіший. Насиченість – це відносна шкала, що вимірюється у відсотках від 0%, що є приглушеним сірим тоном, до 100% – інтенсивною версією цього відтінку. 

Діапазон насиченості дозволяє вибрати відсоток насиченості вище та нижче налаштованого кольору, який буде відображатися як цей колір. Наприклад, червона куля при тьмяному освітленні може виглядати як 50% насиченість. З діапазоном насиченості 0,25 (десятковий еквівалент 25%), будь-яке значення насиченості від 25% до 75% буде відображатися як налаштований червоний колір.

Розуміння пікселів та роздільної здатності

Схема мультяшного будинку, намальована на сітчастому папері, де деякі квадрати повністю розфарбовані для позначення пікселів.

Уявіть, що ви малюєте картинку на аркуші паперу з сіткою. Кожен крихітний квадратик на папері — це як пікселів. Коли ви розфарбовуєте ці квадрати, ви створюєте свою картинку.

Низька роздільна здатність Висока роздільна здатність
Робот VEX 123 показано з дуже низькою роздільною здатністю, щоб продемонструвати окремі пікселі на дисплеях з низькою роздільною здатністю. Робот VEX 123 показано з високою роздільною здатністю для демонстрації чіткішого зображення на дисплеях високої роздільної здатності.

Тепер поговоримо про . Роздільна здатність – це кількість пікселів на зображенні. Якщо у вас на папері з сіткою багато крихітних квадратиків (пікселів), ваше зображення виглядатиме чітким і деталізованим. Але якщо у вас лише пікселів, ваше зображення може виглядати розмитим і не дуже чітким.

Діаграма роздільної здатності сенсора зору штучного інтелекту. Верхній лівий кут позначено 0, 0, верхній правий кут позначено 320, 0, а нижній лівий кут позначено 0, 240. Центр екрана позначено 160, 120.

Датчик зору зі штучним інтелектом має роздільну здатність 320 пікселів по горизонталі та 240 пікселів по вертикалі. Це означає, що точний центр виявлення збігається з координатами 160 по осі X та 120 по осі Y.

Як датчик зору зі штучним інтелектом вимірює об'єкти

Дані, що повідомляються датчиком

Датчик зору зі штучним інтелектом збирає дані про налаштовані кольори, теги AprilTags та класифікації штучного інтелекту. Деякі з цих даних відображаються в утиліті AI Vision і можуть допомогти під час планування та створення проекту VEXcode. 

Показано, що датчик зору штучного інтелекту відстежує синій Бакібол. Бакібол має прямокутник відстеження навколо себе, а позначка вище показує, що його ширина становить 80 пікселів, а висота — 78 пікселів. Червоні стрілки підкреслюють прямокутник відстеження, демонструючи його ширину та висоту.

Ширина та висота

Це ширина або висота виявленого об'єкта в пікселях.

Вимірювання ширини та висоти допомагають ідентифікувати різні об'єкти. Наприклад, Бакібол матиме більшу висоту, ніж Кільце.

 

Показано, що датчик зору штучного інтелекту відстежує синій Бакібол. Бакібол має прямокутник відстеження навколо себе, а позначка вище показує, що його позиція X становить 176, а позиція Y — 117. Центр прямокутника відстеження виділено, щоб показати, що положення вимірюється від центру.

CenterX та CenterY

Це центральні координати виявленого об'єкта в пікселях.

Координати CenterX та CenterY допомагають з навігацією та позиціонуванням. Датчик зору зі штучним інтелектом має роздільну здатність 320 x 240 пікселів.

Анімація червоного та зеленого квадратів, що обертаються разом, щоб продемонструвати значення кута на 360 градусів.

Кут

Кут – це властивість, доступна лише дляколірних кодів таквітень (теги. Це показує, чи виявленийColor Codeабо AprilTag орієнтований по-різному.

 

Показано, що датчик зору штучного інтелекту відстежує синій Бакібол. Бакібол має прямокутник відстеження навколо себе, а позначка вище показує, що його позиція X становить 176, а позиція Y — 117. Лівий верхній кут прямокутника відстеження виділено, щоб показати, що початкове положення вимірюється від його лівого верхнього кута.

ПоходженняX та ПоходженняY

OriginX та OriginY – це координата у верхньому лівому куті виявленого об'єкта в пікселях.

Координати OriginX та OriginY допомагають з навігацією та позиціонуванням. Поєднуючи цю координату з шириною та висотою об'єкта, можна визначити розмір рамки розміру об'єкта. Це може допомогти у відстеженні рухомих об'єктів або навігації між об'єктами.

 

Утиліта штучного інтелекту бачення відстежує три теги AprilTag. Кожна мітка ідентифікована, розташована та окреслена, що вказує на її відстеження системою. Ідентифікатори AprilTag у цьому прикладі мають значення 0, 9 та 3.

Ідентифікатор тегу

Ідентифікатор тегу доступний лише для AprilTags. Це ідентифікаційний номер для вказаного AprilTag.

Визначення конкретних тегів AprilTags дозволяє вибіркову навігацію. Ви можете запрограмувати свого робота рухатися до певних міток, ігноруючи інші, ефективно використовуючи їх як покажчики для автоматичної навігації.

Утиліта AI Vision відстежує чотири об'єкти: два BuckyBall та два Ring. Кожен об'єкт ідентифікується, локалізується та окреслюється, що вказує на його відстеження системою. Утиліта також показує оцінку класифікації ШІ кожного об'єкта, у цьому прикладі кожна оцінка становить 99%.

Рахунок

Властивість score використовується під час виявленнякласифікацій ШІ за допомогою датчика ШІ зору.

Показник достовірності показує, наскільки впевнений датчик зору зі штучним інтелектом у своєму виявленні. На цьому зображенні видно 99% впевненість у визначенні класифікацій ШІ цих чотирьох об'єктів. Ви можете використовувати цей бал, щоб ваш робот зосереджувався лише на дуже впевнених виявленнях.

For more information, help, and tips, check out the many resources at VEX Professional Development Plus

Last Updated: