您的当前位置:首页 > 时尚 > google这一“大招”,要逼去世多少多AI标注公司? 正文
时间:2025-02-27 01:51:20 来源:网络整理 编辑:时尚
手工小作坊,事实敌不外工场流水线。假如说,当下的天生式AI,是一个正在结子妨碍的孩子,那末源源不断的数据,便是其饲养其妨碍的食物。而数据标注,便是制作这一“食物”的历程。可是,这一历程真的很卷,很累人
手工小作坊 ,大招事实敌不外工场流水线。逼去标注
假如说 ,世多少多当下的公司天生式AI
,是大招一个正在结子妨碍的孩子,那末源源不断的逼去标注数据 ,便是世多少多其饲养其妨碍的食物
。而数据标注 ,公司便是大招制作这一“食物”的历程。可是逼去标注,这一历程真的世多少多很卷,很累人 。公司妨碍标注的大招“标注师”不光需要一再地识别出图像中的种种物体
、颜色、逼去标注形态等,世多少多无意分致使需要对于数据妨碍洗涤以及预处置
。随着AI技术的不断后退,家养数据标注的规模性也日益展现 。家养数据标注不光耗时耗力,而且品质无意难以保障
。为了处置这些下场
,google最近提出了一种用大模子替换人类妨碍偏好标注的措施,称为AI反映强化学习(RLAIF) 。钻研服从表明,RLAIF可能在不依赖人类标注的情景下
,发生与人类反映强化学习(RLHF)至关的改善下场 ,两者的胜率都是50%。同时,RLAIF以及RLHF都优于把守微调(SFT)的基线策略 。这些服从表明 ,RLAIF不需要依赖于家养标注
,是RLHF的可行替换妄想。那末 ,假使这一技术未来真的推广
、普遍