Hiểu dữ liệu trong tiện ích AI Vision

Tiện íchAI Vision cho phép bạn kết nối và cấu hình Cảm biếnAI Visioncủa mình. Để biết cách thực hiện, bạn có thể đọc các bài viết sau đây:

Hiểu được cách Cảm biến thị giác AI phát hiện và đo lường các vật thể có thể giúp bạn sử dụng tốt hơn các phép đo này trong các dự án lập trình của mình. Với kiến thức này, bạn có thể cải thiện kỹ năng lập trình và tạo ra các giải pháp chính xác hơn cho các nhiệm vụ như nhận dạng đối tượng và phân tích không gian.

Hiểu về Pixel và Độ phân giải

grid-doodle-house.png

Hãy tưởng tượng bạn đang vẽ một bức tranh trên một tờ giấy kẻ ô vuông. Mỗi ô vuông nhỏ trên giấy giống như một pixel . Khi bạn tô màu vào những ô vuông này, bạn đang tạo nên bức tranh của mình.

Độ phân giải thấp Độ phân giải cao

Bây giờ, chúng ta hãy nói về độ phân giải . Độ phân giải là số điểm ảnh trong một hình ảnh. Nếu bạn có nhiều ô vuông nhỏ (pixel) trên giấy kẻ ô vuông, bức ảnh của bạn sẽ trông sắc nét và chi tiết. Nhưng nếu bạn chỉ có một vài pixel, hình ảnh của bạn có thể trông mờ và không rõ nét.

Cảm biến AI Vision có độ phân giải 320 pixel theo chiều ngang và 240 pixel theo chiều dọc. Điều này có nghĩa là tâm phát hiện chính xác sẽ thẳng hàng với tọa độ 160 trên trục X và 120 trên trục Y.

Cảm biến thị giác AI đo lường các đối tượng như thế nào

Cảm biến AI Vision thu thập dữ liệu về màu sắc đã cấu hình, AprilTags và Phân loại AI. Một số dữ liệu này được hiển thị trong AI Vision Utility và có thể hữu ích khi lập kế hoạch và tạo dự án VEXcode. 

Một thùng rượu xanh đang được theo dõi bằng hệ thống thị giác. Một đường viền màu trắng bao quanh vật thể, với một chữ thập màu trắng ở giữa bên trong đường viền. Nhãn trên cùng bên trái cho biết đối tượng là một Thùng màu xanh, cùng với tọa độ trung tâm CX:174, CY:95 và kích thước W:50, H:57.

Chiều rộng và chiều cao

Đây là chiều rộng hoặc chiều cao của vật thể được phát hiện tính bằng pixel.

Các phép đo chiều rộng và chiều cao giúp xác định các vật thể khác nhau. Ví dụ, một cái thùng sẽ có chiều cao lớn hơn một quả bóng thể thao.

Một thùng rượu xanh đang được theo dõi bằng hệ thống thị giác. Một đường viền màu trắng bao quanh vật thể, với một chữ thập màu trắng ở giữa bên trong đường viền. Nhãn trên cùng bên trái cho biết đối tượng là một Thùng màu xanh, cùng với tọa độ trung tâm CX:163, CY:95 và kích thước W:50, H:57.

CenterX và CenterY

Đây là tọa độ trung tâm của đối tượng được phát hiện tính bằng pixel.

Tọa độ CenterX và CenterY giúp điều hướng và định vị. Cảm biến AI Vision có độ phân giải 320 x 240 pixel.

Góc

Góc là một thuộc tính chỉ khả dụng choMã màuAprilTags. Điều này thể hiện liệu Mã màuhoặc AprilTag được phát hiện có định hướng khác nhau hay không.

Một thùng rượu xanh đang được theo dõi bằng hệ thống thị giác. Một đường viền màu trắng bao quanh vật thể, với một chữ thập màu trắng ở giữa bên trong đường viền. Nhãn trên cùng bên trái cho biết đối tượng là một Thùng màu xanh, cùng với tọa độ trung tâm CX:176, CY:95 và kích thước W:50, H:57. Một hình vuông nhỏ màu đỏ làm nổi bật góc trên bên trái của đối tượng.

OriginX và OriginY

OriginX và OriginY là tọa độ ở góc trên bên trái của đối tượng được phát hiện tính bằng pixel.

Tọa độ OriginX và OriginY giúp điều hướng và định vị. Bằng cách kết hợp tọa độ này với Chiều rộng và Chiều cao của đối tượng, bạn có thể xác định kích thước hộp giới hạn của đối tượng. Điều này có thể giúp theo dõi các vật thể chuyển động hoặc điều hướng giữa các vật thể.

Một thùng rượu xanh đang được theo dõi bằng hệ thống thị giác. Một đường viền màu trắng bao quanh vật thể, với một chữ thập màu trắng ở giữa bên trong đường viền. Nhãn trên cùng bên trái cho biết đối tượng là một Thùng màu xanh, cùng với tọa độ trung tâm CX:178, CY:95 và kích thước W:50, H:57. Một thẻ AprilTags màu tím đang được theo dõi bằng hệ thống thị giác. AprilTag được gắn nhãn ID:3, hiển thị tọa độ A:350°, X:206, Y:47, W:29, H:29. Mỗi thẻ có đường viền màu trắng và hệ thống sẽ theo dõi vị trí và hướng của chúng.

ThẻID

TagID chỉ khả dụng cho Phân loại AI và AprilTags. Phân loại AI sẽ hiển thị tên riêng của nó.

AprilTags sẽ hiển thị số ID thực tế.

Việc xác định AprilTag cụ thể cho phép điều hướng có chọn lọc. Bạn có thể lập trình cho robot của mình di chuyển đến các thẻ nhất định trong khi bỏ qua các thẻ khác, sử dụng chúng như các biển báo để điều hướng tự động.

thay thế

Điểm

Thuộc tính điểm được sử dụng khi phát hiệnPhân loại AI bằng Cảm biến thị giác AI.

Điểm tin cậy cho biết mức độ chắc chắn của Cảm biến thị giác AI về khả năng phát hiện của nó. Trong hình ảnh này, AI có thể xác định chính xác 99% Phân loại của bốn đối tượng này. Bạn có thể sử dụng điểm số này để đảm bảo robot của bạn chỉ tập trung vào những phát hiện có độ tin cậy cao.

Để biết thêm thông tin về cách mã hóa Robot mã hóa VEX AIM của bạn bằng dữ liệu này, hãy truy cập Tài liệu tham khảo API VEXcode - AIM.

For more information, help, and tips, check out the many resources at VEX Professional Development Plus

Last Updated: