今日潍坊新闻

最新菠菜发布:手机App平台化身AI学习后盾 配对外行人助建数据标注资料库 省开发时间

来源:潍坊新闻网 发布时间:2020-01-07 浏览次数:

申博sunbet www.0-577.com

申博Sunbet官网 www.0-577.com欢迎您的加入。

-------------------------

【明报专讯】人工智能软件在科技界炙手可热,然而要令AI自行运作,开发者往往需要先向它提供大量经过标注(Labelling)的相片、文字、录音等,涉及大量机械化而又简单的工作。有初创公司看准这一点,利用手机App作为配对平台,将以上劳力密集和机械化的工作外包给普通人,既释放开发人员的宝贵时间,亦可降低整体开发成本,普通人也可在空闲时间赚取收入,一举三得。

明报记者 薛伟杰

Datax Limited行政总裁黄伟俊、用户界面设计师谭逸曦、科技总裁龙羽骞均表示,人工智能软件普遍设计成具备「机器学习」自学功能,前提是先要人类向它们提供大量例子「训练」,机器才能够从例子中自行观察和学习。举例说,若要人工智能准确辨认「什么是汉堡包」,开发者要先输入很多不同角度、不同背景的汉堡包相片,亦须包含不完整的汉堡包例如露出馅料或已被吃掉部分的图像,并从中指出哪件物件是汉堡包,人工智能软件才能从海量相片中总结经验,找出共通。

开发者有时会输入一些似是而非的相片(例如面包),指明它们并非汉堡包,训练才算完整。这种从相片中指出汉堡包或非汉堡包的工作,就称为「数据标注」(Data Labelling)。

Nokia 终于要推「真旗舰」!传以五镜头正面挑战 iPhone

(图/记者黄敬淳摄)据传,Nokia下一代旗舰机将改用当季处理器高通S865,并再度延期,时间会与苹果iPhone正面撞上,该款机型将是Nokia旗下首款规格最到位的「真旗舰」。近年积极主打的中阶

「数据标注」是相当机械化、劳力密集的工作,不涉编程知识,若由软件开发人员兼顾其实很不化算。以往有大学或软件公司会聘请大学生当兼职,专门负责数据标注工作。即使如此,成本效益也未必是最好。而且,有些数据标注工作可能需要主观的判断或认识,或者地区特色(如语言、文化、种族等),尽量每次分配给最适合的人或者多些人负责,会胜过每次都交给固定几名兼职员工。

Datax Limited负责人读大学时,曾协助一间跨国时装公司将数以万计时装相片按风格分类,以便训练该公司的人工智能软件。当时,他们将相片分类成喇叭裤、窄脚裤、Hip Hop、韩风等,但他们发现若由男士看男装,女士看女装,其分类可能会更加准确。又例如,若要训练一套人工智能软件准确辨识一句广东话,就需要收集很多人说同一句广东话的语音,而不能仅仅倚赖几名兼职员工。

配对外判机械化工序普通人挣外快

发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
用户名: 验证码:点击我更换图片