【睿尔曼-RealMan】RM机械臂YOLOV8-ROS视觉抓取

Lamont 2024-05-09

1.概述

YOLOv8 是一个 SOTA 模型，它建立在以前 YOLO 版本的成功基础上，并引入了新的功能和改进，以进一步提升性能和灵活性。具体创新包括一个新的骨干网络、一个新的 Ancher-Free 检测头和一个新的损失函数，可以在从 CPU 到 GPU 的各种硬件平台上运行。

ultralytics没有直接将开源库命名为 YOLOv8，而是直接使用 ultralytics 这个词，原因是ultralytics将这个库定位为算法框架，而非某一个特定算法，一个主要特点是可扩展性。其希望这个库不仅仅能够用于 YOLO 系列模型，而是能够支持非 YOLO 模型以及分类分割姿态估计等各类任务，便于扩展开发应用。

Yolov8的安装十分方便，安装依赖库就可以直接调用，以Ubuntu20.04系统为例，直接使用

# 使用清华大学的镜像源安装

pip install ultralytics -i https://pypi.tuna.tsinghua.edu.cn/simple/

后续直接调用ultralytics 库就可以使用yolov8。（注意yolov8只支持python3.8及以上版本，更多依赖请参照官网requirements.txt）

2.实现

由于前面已经安装好yolov8，因此我们只需要将D435的图像数据流给到yolov8，让其对每一帧图像进行检测，返回检测结果，最后利用深度图像和标定结果得到物体坐标，最后就可以完成抓取实现。

第一步就是建立图像数据流并进行YOLOV8检测，代码如下

首先加载三方库

注意vi_grab.msg中的ObjectInfo消息类型需要提前定义并编译好，示例中的消息格式为

然后初始化D435相机

然后获取图像数据，这里获取像素点对应深度是通过D435的点云模式获得的，是属于realsense2的内部集成算法，用户可以根据自己的使用情况制定更加精确的算法，以保证测量的准确性。

最后就是主函数调用逻辑

至此，我们在开启ROS Master时，通过运行此文件，就可以实时检测并显示D435的图像，并且将物体的坐标发送到object_pose话题中，后续就可以从话题中拿数据进行更多操作。

上述我们获得了物体在相机坐标系下的坐标，接下来进行视觉抓取，我们还需要得到相机到机械臂基坐标系的标定矩阵，通过手眼标定得到转换矩阵，将物体坐标传入得到物体在机械臂基坐标系下的坐标，最后发送坐标给机械臂，机械臂执行抓取，完成视觉抓取一整套流程。

相机坐标系到机械臂基坐标系转换函数如下，仅供参考

得到标定矩阵后，替换上述代码中的矩阵数据，然后将物体的三维坐标传入，得到最终抓取点结果

result = convert(data.x,data.y,data.z,arm_pose_msg.Pose[0],arm_pose_msg.Pose[1],arm_pose_msg.Pose[2],arm_pose_msg.Pose[3],arm_pose_msg.Pose[4],arm_pose_msg.Pose[5])

再调用RM机械臂的ROS控制机械臂到达物体点