信息阅读

鲍玉昆教授:大数据研究中心《基于多维变量的预测性建模方法及应用研究》专题讲座

时间:2020-09-04

为了促进同学们对学术研究的深入了解,能够结合特定实际问题开展大数据技术的应用与研究,启发科研技术创新意识,我校于202093上午10:00大数据研究中心,举行了“基于多维变量的预测性建模方法及应用研究”的学术专题讲座。紧密围绕“大平台、大团队、大融合、大项目、大育人”的五大理念,本次讲座由大数据研究中心成员鲍玉昆教授主讲,主要面向本校的大数据学术研究兴趣爱好者,约150余名计算机与互联网学院同学有幸聆听了此专题内容

 

首先,鲍教授结合大数据研究中心科研成果很直观地向同学们简要地展示了学术研究的整个过程,有针对性地从同学们熟悉的专业知识引入大数据学术研究领域。在讲座过程中,鲍教授特别指出学术研究创新点的重要性,结合金融、生物工程、能源等不同领域,很风趣地谈及场景应用量纲、数据去噪、特征选择、模型建立、性能评估等大数据研究问题以通俗易懂的方式让同学们全面地认识了大数据技术如何被快速运用到社会生活、工业生产以及经济活动等各个领域。

 

接着,鲍老师从计算复杂性和精度视角,引入了数据处理,重点讲解了特征选择中遗传基因GA和粒子群PSO算法,并结合信号处理技术MEMD,开展针对股票价格回归预测性建模工作。欠拟合(underfitting)和过拟合(overfitting)是导致模型泛化能力不高的两种常见原因。然后从拟合的视角,给同学们科普了预测性建模算法。考虑神经网络需要训练样本大、收敛速度慢、容易进入局部极小值,以及参数较多等不足之处,提出了支持向量机(SVM)的优势。鲍老师运用大数据思维,结合真实案例从数据获取、特征提取、技术架构、算法选择和预测建模等方面呈现了学术研究的整个过程。

 

 

 

接着,黄老师通过“如何根据西瓜的特征判断其成熟度”以及“新型肺炎的特征对于疫苗研制的重要性”这两个例子让同学们更深刻地了解大数据时代特征选择的重要性,并从大数据的“5V”,工业革命智能化的需要引入了大数据技术,强调大数据就像蜜蜂一样,其主要价值是传播花粉,而自己产生的蜂蜜价值并不足为题。她指出大数据思维是科学研究的一种新形式:在数据探索中,我们不仅仅要研究算法,还要研究inputs(单输入还是多输入)哪里来,outputs(单输出还是多输出)到哪里去,以及inputs和outputs的相关性。拟合相关性,建立分类或回归预测性模型直接关系到运行效率和预测精确度。然后她幽默地指出,得数据者得“天下”,早在三国有两个大数据最佳应用者:诸葛亮和司马懿。

 

 

最后,通过源代码的讲解和算法运行直观演示,给在座的同学们详细介绍了基于多维变量的预测建模过程、多维度的实验分析以及预测性能的评估鲍教授针对如何获得和掌握完整而系统的大数据相关知识和同学们进行了激烈讨论提出了很好的意见和建议。

 

此次鲍教授的讲座信息量大,同学们受益匪浅,富有感染力的精彩讲解不时迎来阵阵掌声!相信同学们通过未来的努力学习,规范学术研究,在求学道路越走越宽。