【睿尔曼-RealMan】基于大模型的智慧零售教育科研平台——技术方案
周正 2024-05-31
- 基于大模型的智慧零售教育科研平台——技术方案
一、产品概述
1.1产品背景
随着数字经济的快速发展和全社会数字化水平的升级,人工智能的积极作用越来越凸显,人工智能与各个行业的深度融合已成为促进传统产业转型升级的重要方式之一。ChatGPT的出现掀起了又一波人工智能发展热潮,人工智能行业发展势头强劲,市场规模持续上升,正逐步进入效率化生产阶段,为用户带来了更加个性化的服务和产品。
近年来,中国人工智能行业受到各级政府的高度重视和国家产业政策的重点支持,国家陆续出台了多项政策,鼓励人工智能行业发展与创新,《关于支持建设新一代人工智能示范应用场景的通知》《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》《新型数据中心发展三年行动计划(2021-2023年)》等产业政策为我国人工智能产业发展提供了长期保障。而人工智能结合机器人,成为产业发展风向标,使机器人具有“智慧”,服务日常生活,成为机器人产业发展的流行趋势。
2023年1月《“机器人+”应用行动实施方案》指出,当前,机器人产业蓬勃发展,正极大改变着人类生产和生活方式,为经济社会发展注入强劲动能。预计到2025年,制造业机器人密度较2020年实现翻番,服务机器人、特种机器人行业应用深度和广度显著提升,机器人促进经济社会高质量发展的能力明显增强。
在智慧零售领域,大模型技术具有数据处理能力强、预测准确度高、智能化水平高等显著优势。通过构建庞大的数据集和复杂的算法模型,大模型能够实现对市场趋势的准确预测以及商品库存的智能管理,同时能够根据消费者的购物历史和偏好,提供定制化的购物体验,从而提高销售额和顾客满意度。
1.2功能简介
本产品以大模型技术与机器人技术在“智慧零售”这一垂直领域应用的实际需求为应用背景,模拟在无人零售店等新型零售模式场景中,大模型通过分析消费者行为数据,提供个性化的商品推荐;通过图生文技术和自然语言处理技术,提高交互效率和便捷性;通过智能机械臂完成对商品的识别、定位与抓取,通过图像识别技术实现商品识别和结算,提高购物体验,最终实现协助零售商户智能识别客户需求。产品功能如下:
(1)智慧视觉辨识:利用大模型的强大计算能力和视觉识别技术,系统能够实现对货架上商品的高精度识别,确保每一个商品都能被精确地辨识和分类。
(2)环境感知物体跟踪:结合大模型与深度学习算法,本功能可实时检测并追踪货架上商品的位置和状态,为智能物流和库存管理提供实时数据。
(3)互动式语音交互:通过大模型集成的自然语言处理能力,平台可通过自然且友好的语音交互与用户沟通,提供即时信息反馈和导购服务。
(4)洞察消费者辅助决策:利用大模型根据顾客行为、面部表情分析,生成消费者洞察报告,帮助零售商理解顾客需求,优化商品组合。
(5)智能精准操控:以大模型技术为支撑,智能机械臂能够自动精准地识别目标商品,并完成复杂的抓取与搬运任务,展现了先进的自动化操作能力。
(6)智能化结算分析:此功能集结大模型的数据分析和图像识别技术,能够在短时间内完成对结算区商品的自动识别和计价,提供一站式智能结算解决方案。
通过本套产品,可培养学生掌握边缘端大模型应用的环境部署能力,了解和熟悉机械臂运动控制技术、机器视觉、语音识别、多传感器融合应用技术、机械臂视觉抓取控制技术、移动滑轨与机械臂协调控制技术等多项大模型技术和智能机器人技术,同时培养学生的创新能力、团队协作能力等综合职业素养,为中高职院校、高等院校人才培养更接近与实际的企业工作岗位需求。
1.3产品特点
1.3.1产品优势
基于大模型的智慧零售教育科研平台集主控与执行机构与一体,主控中采用目前主流的大模型与图文生成技术,通过自然语言处理,实现对外部环境的感知与分析;执行机构使用超轻量仿人机械臂,基于目标检测技术,通过机械臂运动规划等功能,完成任务执行与环境交互功能。基于大模型的智慧零售教育科研平台同时具备商业应用、教学实训及科研实验的特性,是融合应用与科教一体的平台,因此其支持各类型高校专业实训、课程设计、毕业设计等实训环节的教学,也满足各科研院所基础实验测试及二次开发需求,实训平台主要有以下优势:
(1)多功能性:基于大模型的智慧零售教育科研平台可以执行多种任务,包括语音交互、视觉抓取等。
(2)智能化技术支持:基于大模型的智慧零售教育科研平台集成了人工智能技术,例如机器视觉、深度学习及大模型等前沿技术,能够实现环境感知和自主决策,提升实验的智能化水平,并且对于前沿的人工智能技术具备良好的适配性,各类最新智能算法及AI解决方案能够轻松在平台上验证,对于高层次人才培养和深度科研探索有坚实的基础支撑。
(3)灵活性:平台结构设计灵活,可以在不同工作场景下自由移动和操作,适用于多种实验和项目需求。
(4)自动化程度高:基于大模型的智慧零售教育科研平台具备自动化控制功能,能够通过编程实现自动化操作和任务执行,提高实验效率和精度。
(5)跨学科应用:基于大模型的智慧零售教育科研平台涵盖了人工智能、控制工程、计算机等多个学科领域的知识和技术,可以为跨学科的实验和项目提供支持。
(6)实践创新教学:基于大模型的智慧零售教育科研平台为学生提供了实践创新的平台,可以进行项目设计、编程控制、系统集成等实践操作,培养学生的创新能力和实践技能。
(7)设备迭代更新:基于大模型的智慧零售教育科研平台采用模块化组成思想,每个组成部分都能够单独运行使用,因此后续升级与适配十分方便,用户无需整套返厂更新,使用配套器件即可更新硬件与软件。
(8)教学资料配套:基于大模型的智慧零售教育科研平台教学科研平台配套各类型教学资料,包括实训文档、开发文档、实训讲解视频、二次开发实践视频以及实践讲师现场教学等全面的教学支撑,为客户群体提供人性化与定制化的使用与开发服务。
(9)实训平台生态圈:基于大模型的智慧零售教育科研平台教学科研平台提供全方位的生态圈,用户可自行定制与替换各部件,以便完成特定的场景需求,并且基于大模型的智慧零售教育科研平台教学科研平台拥有独立的产品生态论坛,用户可以随时在论坛查找相关生态产品资料以及开发资料,极大地减少客户二次开发应用难度及周期。
1.3.2竞赛支持
“中国机器人及人工智能大赛(CAAI)”是国内首个提出在机器人及人工智能领域,将关键技术的研发与应用有机结合的比赛。自1999年至2023年,中国机器人及人工智能大赛已成功举办了25届,已有600多所高校参与,累计超27万高校学生参赛是目前国内规模最大,影响力最强,专业水平最高的机器人竞赛。参赛院校及师生均可享受A类赛事奖励政策,其涉及计算机、电子、机械、信息、无人机、人工智能等方面,是多学科知识的本融合型大赛。产品能全面支撑师生参与CAAI的基于大模型的智慧零售赛项。
智慧零售竞赛场景设置如下图所示,货架上摆放有矿泉水、可乐、薯片、牛奶等日常零售柜商品,直线导轨台放置在货架前方,机械臂固定在直线导轨台上,可水平移动。具体尺寸、商品类型、商品价格以后续赛事群公布为准。
基于大模型的智慧零售赛项评分表
1.4配套资源
基于大模型的智慧零售教育科研平台配套全面的实训内容与资料,为教育客户群体提供涵盖机器人工程、人工智能、自动化、计算机、通信工程、电子信息等专业的课程教学与实训实验资源,并且提供产品论坛,用户可在论坛中交流与查找相关资料,产品的更新资料也会同步至论坛中,方便用户查收。
1.4.1课程资源
基于大模型的智慧零售教育科研平台提供系统性的教学实验实训内容,包括实训文档及实训视频,深入浅出的讲解基于大模型的智慧零售教育科研平台相关原理与开发流程,以下是部分课程资源概览:
1.4.2可开展实训内容
(1)货架商品信息扫描与语音播报:通过机械臂的运动控制与路径规划,结合视觉识别技术完成对货架商品的排列位置扫描和识别,按货架从上到下,从左到右的顺序播报。本部分实训内容可考察学生对于机械臂运动控制、直线导轨控制、物体识别与定位技术等智能机器人技术的应用
(2)商品推荐:导入任务卡提供的图片,由机器人完成对图片的理解并进行语音播报、然后在货架现陈列商品中选择1个最佳商品推荐并语音播报,最后将推荐商品抓取放置到商品结算区。本部分实训内容要求学生利用大模型的图生文技术,完成对图片的内容理解,并进行商品推荐,利用视觉技术完成物体定位,再结合机械臂控制技术完成对物品的抓取。
(3)商品选购:根据给定商品名称选取正确商品并完成抓取,同时进行语音播报,并根据给定的相对方位信息正确选取商品并完成抓取,同时进行语音播报。根据给定的语义信息正确选择商品并完成抓取,同时进行语音播报。
(4)商品结算:自动识别结算区所有商品信息,完成商品结算并语音播报。考察选手利用图像识别及目标检测技术,精准地对顾客购买的商品进行智能化、自动化的价格结算。当顾客将自己选购的商品放置在指定的区域里,可精准地识别每一个商品,并且能够返回完整地购物清单及顾客应付的实际商品总价格。
(5)创意展示:支持学生进行二次开发
1.5设备组成
(1)基于大模型的智慧零售教育科研平台技术实训平台是专门面向科研与教育培训领域的教学实训平台。集成了从机器人工程、与人工智能等各学科知识内容,学生可以利用平台学习掌握基于大模型的智慧零售教育科研平台理论知识,并在现有工作台上验证,帮助学生从理论知识上升到实际操作。此外,研究人员可以依托平台结合已有科研课题,完成科研实验与算法理论验证。
(2)机械臂系统:睿尔曼RM65系列超轻量机械臂,负载5kg自重7.2kg具有超高的负载自重比,无传统控制柜将控制器与机械臂完美融为一体,一体化机械臂仍自带丰富接口满足多种应用需求扩展,提供丰富的API函数库,便于二次开发。末端具备通用接口,灵活扩展,即插即用,一体化机械臂结构且自带丰富接口,满足多行业应用需求扩展。
(3)主控系统:使用Nvidia Jetson orin nano 模组,该模组预装Ubuntu18.04 系统,算力达到20 Tops,搭载 16个Tensor Core 的512核NVIDIAAmpere与6核Arm Cortex CPU,内存4GB,功率仅7W-10W。
(4)视觉系统:选用 Intel Realsense D435C深度相机,可直接通过 USB3.0 供电和数据通信,能同时获取深度图像与彩色图像,有效距离0.11m~10m,可满足视觉感知环境需求。使用LX-224HV舵机作为头部旋转关节,可进行头部旋转和俯仰控制,扩大机器人的视野感知范围与操作空间。
撰写评论