本网讯 5月24日,由教育部、商务部、无锡市政府联合举办的第十届中国大学生服务外包创新创业大赛在江南大学落下帷幕,我院网络技术系周化老师指导的“飞天小仙女”团队(队长:彭琳,队员:魏陆炀、谭耀飞、林扬凯)获全国总决赛企业命题组(a类)二等奖。
团队抵达江南大学总决赛现场
本次大赛以“点亮青春,服务未来”为主题,吸引了来自复旦大学、武汉大学、日本立命馆大学、马来西亚拉曼大学等500多所海内外院校近4000支团队报名参赛,更邀请阿里巴巴、浪潮、华为等30多家知名企业“出题”,赛题涉及大数据、人工智能、物联网等新技术、新业态,激励企业、院校以新方式推动产业向高新技术、高附加值方向发展,从而为服务外包产业注入新的动力。 作为广东省闯入全国总决赛的两支队伍之一,我院“飞天小仙女”团队总决赛答辩成绩排名第2,赛题成绩排名第21,总排名前0.5 %,最终获大赛二等奖。
获奖合影
获奖证书与奖牌
中国高等教育学会副会长张大良表示,此次大赛有助于增强大学生对服务外包领域的了解,进一步推动人才培养与产业发展的互动融合。
据主办方介绍,十届大赛已累计吸引海内外1600多所院校、40余万名大学生参与,通过建设大学生服务外包创新创业基地,设立创业孵化基金,举办大学生训练营、项目投融资路演等活动,已累计为服务外包产业输送了近15万名创新人才。今年2月,大赛成功跻身中国高等教育学会发布的“全国高校学科竞赛排行榜评估体系”,成为评估全国高校创新创业人才培养质量的重要指标之一。
团队成员与其他学校团队交流
分类一直是数据科学界研究的重点问题,并被广泛地应用到现实生活的各个方面。伴随着电商行业的快速发展,商品的数量越来越多,这就需要对商品进行分类,以便找寻自己所需的商品。如果采用人工分类,不仅工作量大、速度慢,而且有时也会出现分类错误的情况。
由我院谭耀飞、林扬凯、魏陆炀、彭琳带来的HPTC网络零售平台商品分类系统则是一套对电商商品名称进行快速准确分类的系统。在分类问题解决方案中,性能的优劣取决于分类器的时间复杂度、准确率和硬件需求。综合以上因素,来自我院的同学们设计了一款基于smote改进的fasttext的精准快速分类模型,其主要创意有四个方面。一是基于Smote算法过采样技术解决数据不均衡造成的过拟合情况,在分类器输入层内嵌Smote算法对其每个K临近值进行过采样;二是树结构预测降低了模型训练的硬件要求,采用多级预测的思路,将文本的预测分为三级,构造一棵1/22/192三层树模型对应预测各级标签下的子标签;三是快速的文本分类训练与预测。本方案采用Fasttext快速文本分类器,该分类器仅有一层隐层及输出层,与著名的CBOW模型不同的是,该模型将输出层改为文本标签,而非取模型参数作为词向量,因此有着深度学习无法媲美的训练速度,同时在速度上预测已分词的文本数据集时,预测速度可达13440条/min。四是企业级的预测准确率为97.47%。改进的FastText的精准快速分类模型在保证了极其高效率的训练速度与预测速度下,经过5次交叉检验后得到的分类准确率比SVM文本分类器高33.2%,比TextCNN高19.53%,比TextRNN高17.94%,比原始FastText分类器高15.86%。
图片:作品界面
(供稿:网络技术系 编辑:李晓敏)