VEXcode EXPのAI Vision Utilityのデータを理解する – VEX ライブラリ

AI ビジョンユーティリティ を使用すると、AI ビジョンセンサーを接続して構成できます。その方法については、次の記事を参照してください。

AI ビジョンセンサーがオブジェクトを検出して測定する方法を理解すると、コーディングプロジェクトでこれらの測定値をより有効に活用できるようになります。この知識があれば、コーディングスキルを向上させ、オブジェクト認識や空間分析などのタスクに対してより正確なソリューションを作成できます。

色相と彩度を理解する

カラー署名のオプションが表示された AI Vision Utility。カラーシグネチャの名前は Blue で、色相範囲の値は 32、彩度範囲の値は 0.57 です。

カラーシグネチャを構成するときに、色相範囲と彩度範囲の両方のオプションが表示されます。これらにより、カラーシグネチャをより耐性のあるものに調整できます。オブジェクトを移動しても AI ビジョンユーティリティで追跡できる場合、カラーシグネチャは復元力があると見なされます。

360 度の円が色相値とどのように相関するかを示すカラーホイール。赤色は 0 度、緑色は 120 度、青色は 240 度です。

最初のスライダーは 色相範囲です。色相は、色相環上の位置によって定義される、知覚される色です。このカラーホイールの範囲は 0 ～ 359.9 度で、ホイール上の各色には定義された度数値があります。

色相範囲では、設定した色の上と下の何度がその色として報告されるかを選択できます。たとえば、濃い青の色相値は 240 度になります。色相範囲が 20 度の場合、220 度から 260 度までの色はすべて濃い青に構成された色として報告されます。

彩度値が 0% から 100% に増加するグラフ。彩度値が 0% の場合は灰色、彩度値が 100% の場合は明るい赤色になります。

2 番目のスライダーは 彩度範囲です。彩度は色の強さまたは純度です。色が明るいほど、彩度が高くなります。彩度は、0% からその色相の濃いバージョンである 100% までのパーセンテージで測定される相対的なスケールです。

彩度範囲では、設定した色より上と下の彩度のパーセンテージを選択して、その色として報告することができます。たとえば、暗い照明の下では赤いボールは 50% の彩度として表示されることがあります。彩度範囲が .25 (小数点以下 25%) の場合、25% から 75% の彩度はすべて赤色で構成された色として報告されます。

ピクセルと解像度について理解する

方眼紙の上に描かれた漫画の家の図。一部の正方形はピクセルを表すために完全に色付けされています。

方眼紙に絵を描いているところを想像してください。紙の上のそれぞれの小さな四角は、 ピクセルのようなものです。これらの四角に色を塗ると、絵が完成します。

低解像度

高解像度

さて、 解像度についてお話しましょう。 解像度 は画像内のピクセル数です。グリッドペーパーに小さな正方形 (ピクセル) がたくさんあると、画像は鮮明で詳細に見えます。しかし、 ピクセルが数個しかない場合、画像はぼやけて鮮明でない可能性があります。

AI ビジョンセンサーの解像度の図。左上隅は 0, 0、右上隅は 320, 0、左下隅は 0, 240 とラベル付けされています。画面の中央には 160、120 と表示されています。

AI ビジョンセンサーの解像度は、水平 320 ピクセル、垂直 240 ピクセルです。これは、検出の正確な中心が、X 軸の座標 160、Y 軸の座標 120 に一致することを意味します。

AIビジョンセンサーはどのように物体を測定するのか

センサーによって報告されたデータ

AI ビジョンセンサーは、設定された色、AprilTags、AI 分類に関するデータを収集します。このデータの一部は AI Vision Utility に表示され、VEXcode プロジェクトの計画と作成に役立ちます。

AI ビジョンセンサーが青いバッキーボールを追跡している様子が示されています。 Buckyball の周囲には追跡用の四角形があり、上のラベルには幅が 80 ピクセル、高さが 78 ピクセルであることが示されています。赤い矢印は追跡四角形を強調表示し、その幅と高さを示しています。

幅と高さ

これは、検出されたオブジェクトのピクセル単位の幅または高さです。

幅と高さの測定値は、さまざまなオブジェクトを識別するのに役立ちます。たとえば、バッキーボールはリングよりも高さが高くなります。

AI ビジョンセンサーが青いバッキーボールを追跡している様子が示されています。 Buckyball の周囲には追跡用の四角形があり、上のラベルには X 位置が 176、Y 位置が 117 であることが示されています。追跡四角形の中心が強調表示され、位置が中心から測定されていることを示します。

CenterXとCenterY

これは、検出されたオブジェクトの中心座標（ピクセル単位）です。

CenterX と CenterY 座標は、ナビゲーションと配置に役立ちます。 AI ビジョンセンサーの解像度は 320 x 240 ピクセルです。

角度値の 360 度を示すために、赤い正方形と緑の正方形が一緒に回転するアニメーション。

角度

角度は、カラーコード およびAprilTagsでのみ使用可能なプロパティです。これは、検出されたカラーコードまたは AprilTag の向きが異なっているかどうかを表します。

AI ビジョンセンサーが青いバッキーボールを追跡している様子が示されています。 Buckyball の周囲には追跡用の四角形があり、上のラベルには X 位置が 176、Y 位置が 117 であることが示されています。追跡四角形の左上隅が強調表示され、原点の位置が左上隅から測定されていることを示します。

OriginXとOriginY

OriginX と OriginY は、検出されたオブジェクトの左上隅の座標 (ピクセル単位) です。

OriginX と OriginY 座標は、ナビゲーションと配置に役立ちます。この座標をオブジェクトの幅と高さと組み合わせることで、オブジェクトの境界ボックスのサイズを決定できます。これは、移動するオブジェクトの追跡やオブジェクト間の移動に役立ちます。

3 つの AprilTag が AI Vision Utility によって追跡されています。各タグは識別され、位置が特定され、輪郭が描かれ、システムによる追跡が示されます。この例の AprilTag ID は 0、9、3 です。

タグID

タグ ID は AprilTagsでのみ使用できます。これは指定された AprilTag の ID 番号です。

特定の AprilTags を識別することで、選択的なナビゲーションが可能になります。ロボットを特定のタグに向かって移動し、他のタグを無視するようにプログラムして、それらを自動ナビゲーションの道標として効果的に使用できます。

AI ビジョンユーティリティによって、2 つの BuckyBall と 2 つのリングの 4 つのオブジェクトが追跡されています。各オブジェクトは識別され、位置が特定され、輪郭が描かれ、システムによる追跡が示されます。このユーティリティは、各オブジェクトの AI 分類スコアもリストします。この例では、各スコアは 99% です。

スコア

スコアプロパティは、AI ビジョンセンサーでAI 分類 を検出するときに使用されます。

信頼スコアは、AI ビジョンセンサーの検出の確実性を示します。この画像では、これら 4 つのオブジェクトの AI 分類を 99% の信頼度で識別しています。このスコアを使用すると、ロボットが信頼性の高い検出のみに集中できるようになります。