摘要:对于如何看待程序员等IT行业从业者被划为“新生代农民工”一事,有网友表示“码农”一词算是正式得到官方认证了;也有网友称自己很荣幸成为“新生代农民工”的一员。 |
近几日,新生代农民工一词喜提热搜,引发网友热议。据人社部网站消息:数据显示,新生代农民工就业集中于劳动密集型行业,从事信息传输、软件和信息技术服务业的新生代农民工占比大幅提高。
对于如何看待程序员等IT行业从业者被划为“新生代农民工”一事,有网友表示“码农”一词算是正式得到官方认证了;也有网友称自己很荣幸成为“新生代农民工”的一员。
不过,这也从一个侧面反映出数字经济下劳动力的变化和产业的转型。单就“人工智能”这一几年前还鲜为人知的概念而言,如今已经成为许多企业寻求新机遇的突破口,抑或日常运营中不可或缺的角色。
2021过半,今年的人工智能市场已经呈现出哪些显著的发展趋势?一起盘一盘!也许很快,AI将成为“新生代农民工”新的代言人。
AI发展的瓶颈:高质量数据
研究机构O'REILLY最近发布的一份调查报告显示,人工智能应用的两大瓶颈:一是缺乏技术熟练的员工;二是缺乏数据资源(或数据存在质量问题)。事实上,大多数AI项目迟迟未能投入到“实战”阶段,也反映出在AI研究过程中,数据科学家在获取高质量数据时所面临的挑战和成本。此时,寻求外部专业机构的支持就显得尤为重要。
AI训练数据
更精准的AI应用场景
越来越多的AI企业已经开始缩小其AI模型所针对的业务范围,并将目标具体化。例如,Appen最近参与的几个该类型的AI项目:
商务术语:一家公司构建了一个能对商务术语提出改进建议的AI模型,而这些商务术语之间仅有着非常细微的差异;
身体动作:一家公司在研究个人训练自动化模型时发现,动作轮廓会随着年纪增长而改变,我们需要补充老年人翻跟斗的视频并作相关标注;
小语种:新冠疫情的实时信息需要在全球内发布,但翻译技术并不支持所有语言,Appen开展了针对罕见语种的数据采集和标注工作,比如达里语、丁卡语及豪萨语等。
从以模型为中心向以数据为中心转变
是优化代码,还是提升训练数据质量?这是过去几年间AI行业最为关注的前沿问题之一。以模型为中心的AI是指利用现有数据来构建模型,以弥补任何无关因素和不准确性,而以数据为中心的AI则重点关注数据体量和质量。目前,我们看到了AI行业从以模型为中心向以数据为中心转变的趋势。
训练数据管理的新需求
随着市场对于训练数据需求的日益增加,为规范化管理数据训练的工作流程制定管理框架,就变得尤为重要。有效的数据管理框架应包含以下关键点:
用于追溯的版本控制
数据安全协议
访问控制
数据传输监控
合作协议
AI辅助数据标注愈发火热
自动化机器学习技术的应用日益增加,AI企业也已开始利用人工智能来辅助进行数据标注,以节省时间和降低成本。以下是数据标注自动化的3种主要类型:
预标注:先由AI模型对标注进行合理猜测,然后再由人工标注员进行检查和更正;
快速标注:利用AI功能来节省标注员的标注时间,如澳鹏Appen人工智能辅助数据标注平台的自动补全、一键贴合等功能;
智能验证器:AI对标注员的数据输出进行验证,如标注不在阈值范围内,则会作出提醒。
责任编辑:张华