第313章 第一期理想基金项目成果
在优化算法方面,历景铄最初采用的是传统的随机梯度下降也就是 sgd 算法。
该算法虽然能在理论上逐步逼近最优解,但在实际训练过程中,由于每次只随机选取一个样本进行参数更新,致使梯度的计算过程掺杂了大量噪声,每一次参数更新的方向,都可能因为单个样本的独特性而偏离了通往最优解的正确路径。
这就导致了模型的收敛过程变得极不稳定,训练曲线犹如汹涌波涛中的小船,上下剧烈波动,这样的训练不仅会耗费大量宝贵的时间,还消耗了诸多计算资源,更为糟糕的是,根本无法确保最终能够探寻到全局最优解。
在历经了一段时间的困扰后,历景铄在秦奕的建议下,决定引入小批量随机梯度下降算法。
相比传统 sgd 算法,这一算法不再局限于一次仅使用一个样本,而是每次从训练数据集中选取一个小批量的样本,比如 32 个或 64 个样本,然后每次训练迭代都会依据这一小批量样本计算出的平均梯度来对模型参数进行更新。
这样一来,小批量样本的平均梯度能够在一定程度上抵消单个样本梯度的噪声,使得参数更新的方向更加稳定。
不过历景铄并未满足于此,后续为了进一步提升小批量随机梯度下降算法的性能,他潜心钻研,引入了自适应学习率调整策略。
学习率是神经网络模型训练里面一个非常关键的因素,简单来说,学习率就像是模型在学习过程中的 “步伐大小”,当模型通过计算后的梯度来更新参数时,学习率决定了每次参数更新的幅度。
想象一下,模型学习就如同一艘寻宝船在海上寻宝,问题的最优解这个宝藏藏在大海上的某个岛屿内。
如果学习率设置得过大,在训练初期,由于距离最优解还比较远,大步前进确实可能会让模型快速地靠近目标区域,就像在茫茫大海上,寻宝船一开始朝着大致方向奋力前行,能快速缩短与宝藏岛屿的距离。
但当逐渐接近最优解时,过大的步伐就会成为阻碍,类似于你寻宝时已经隐约看到宝藏所在的小岛轮廓,却因为步子太大,一下子就越过了最佳登陆点,然后又不得不折返回去,如此反复,模型便会在最优解附近来回振荡,难以精准地收敛到精确的最优解。
相反,如果学习率设置得过小,模型就像一艘移动速度极慢的寻宝船,虽然这样能保证每一步都走得很稳,不会轻易错过最优解,但是前进的速度会非常慢,需要花费大量的时间和计算资源才能达到最优解,甚至可能在有限的训练时间内根本无法到达。
历景铄设计的自适应学习率策略,就是根据训练的进展动态调整这个 “步伐大小”。
在训练前期,他为模型设置相对较大的学习率,让它迅速捕捉到数据中的关键特征。
后续随着训练轮数的增加,他依据预先设定好的衰减公式,让学习率按照一定的衰减率逐渐减小,这样模型能够更加精细地调整参数,从而提高了收敛的精度和速度,让模型能够更准确、更高效地找到最优解。
与此同时,历景铄还对小批量样本的选取方式进行了优化,他不再是简单地随机选取小批量样本,而是采用了分层抽样的方法。
考虑到 nist 数据集中不同数字的分布情况,他将数据集重新整理并划分出来多个批次。
每个批次的小批量样本各类数字的比例与整个数据集的比例大致相同,这样做的好处是,模型在每次参数更新时,都能均衡地学习到各类数字的特征,避免了因某些数字在小批量样本中出现频率过低而导致学习不充分的问题。
历景铄优化后的训练过程与卷积神经网络完美配合,二者相得益彰,关键指标识别准确率逐步提高,经过将近两个月夜以继日的训练与反复调整,最终,模型的识别准确率达到了 923。
这个成绩让历景铄震惊不已,因为这一成果意味着他在神经网络领域实现了突破性的进步。
此前,学术界流行的多感知机模型的最高准确率仅为 80,与之相比,此次的提升可谓是飞跃式的。
历景铄兴奋不已,他第一时间就找到秦奕,两人热烈地讨论着向国内由华国科学院计算技术研究所主办的计算机领域核心期刊《计算机学报》投稿的事宜,这一成果不仅是个人的荣耀,更可能为国内的计算机科学研究带来新的思路和启发。
除了历景铄这个项目取得了令人瞩目的进展之外,理想基金所支持的另外两个项目 —— 胡玮武的龙芯和王天苗的机器人项目,同样也收获了不错的成果。
胡玮武一直专注于芯片研发工作,目前,他已经成功利用在魔都的生产线完成了流片。
赵启阳他得知胡玮武的成果后,立刻打算在明年斗将系列的下一款产品《斗将封神》的硬件中采用这款图形处理芯片,期望以此来显着提升游戏的显示效果,为玩家带来更加震撼的视觉体验。
启明微机那边也听闻了这款新芯片的消息,倪广楠也表示希望尝试使用这款图形处理芯片,为微机产品的性能提升增添新的亮点。
完成流片之后,胡玮武在与 “531” 芯片制造战略珠江基地负责人吕智明交流时了解到,港岛这边的生产线生产工艺比魔都的制造厂更为先进,而更先进的生产工艺将有助于提升芯片的质量和生产效率,为龙芯的大规模应用奠定坚实基础。
经过一番深思熟虑,他计划寻找港岛企业来进行芯片的量产工作。
王天苗的机器人项目也在稳步推进。
孟嘉佑一开始通过深入细致的调研了解到鹏城华强北那边的众多电子厂,因近期订单量的季节性波动,出现了大量闲置产能,不少工厂为了充分利用资源,纷纷利用现有设备和人力,开展起简单的食品加工业务,生产诸如坚果、果脯等零食。
王天苗在得知这个消息之后就敏锐地意识到,这对于团队研发的搬运机器人来说是个绝佳的实验场地,搬运机器人在电子厂的食品加工环节进行实验,不仅能在真实环境中不断调试优化,还能收集到大量有价值的数据,为后续产品的改进和推广提供坚实支撑。
由于有了初步的产品以及经营收入,胡玮武和王天苗两人都分别创办了各自的公司来进行经营活动。
胡玮武的公司名称和项目相同,就叫龙芯科技,简单直接地表明了公司的核心业务。
而王天苗的公司则叫天元科技,寓意着在科技领域开创一片新的天地。
时光匆匆,转眼间就到了十月中旬。
新一年的鸿蒙应用软件大赛和理想基金又开始接受报名了。