年轻有为,深耕数据科学宝库
2009年获得宾夕法尼亚大学最佳博士论文奖,2013年因在“大范围多重假设检验”领域深入而系统的研究获美国国家科学基金会杰出青年教授职业奖,2018年在英国皇家统计学会期刊发表讨论文章并受邀做专题报告,2013和2021年两次获得南加利福尼亚大学马绍尔商学院杰出研究奖,2010年至2022年作为主要负责人连续四次获得美国自然科学基金,2022年获马绍尔商学院MBA核心课程最佳教学奖……
一条条履历,诉说着这位数据科学专家的非凡经历,由此也能看出他深耕数据科学宝库的底气与实力。
孙文光提出的“大范围多重假设检验和错误发现率控制方法”为从海量和高维的数据中发掘价值提供了一个有力的工具。这项统计方法在基因组学、蛋白质组学、生物制药、图像分析和金融学等重要大数据应用领域中,可以帮助研究者从几千个甚至上百万个变量中迅速准确地找到重要变量以及有用信息。
在博士论文中,他创造性地推导出了关于控制错误发现率具有最优性的初步解决方案。毕业之后,他将成果拓展到了更有挑战性的具有相关结构、组群结构、异方差结构、空间结构、分层结构等不同数据类型。这些成果让他在2013年获得了美国国家科学基金会杰出青年教授奖——在统计方向,这项荣誉每年仅颁发给4位最有潜力的年轻学者。

近年来,孙文光聚焦于整合分析和迁移学习,探究如何将多源高维数据中重要的结构化信息、关联性信息和外部的相关知识有效整合并纳入最终的统计推断过程。这些方法可以提高最终解决方案的功效、准确度和可解释性。
“我们在处理许多复杂的大数据问题时常常会采用华丽炫目的分析工具和算法,但研究问题不能迷失在技术性的细节中。深入理解并不断拓展统计学的经典思想和基础原理可以帮助我们从整体的角度去思考和探索,不在海量的数据和复杂的算法中迷失。”孙文光说。
推广数据科学,点亮教学的明灯
在获得的众多奖项中,颇令孙文光自豪的一个是南加大马绍尔商学院颁发的“Golden Apple最佳教学奖”。学生们经过两年MBA学习之后,在所有学习过的核心课程中投票选择对自己影响最大的一门课——这珍贵的一票纷纷被投给了孙文光的《数据科学》。
“同学们对数据科学从畏惧到热爱,是对我这些年努力的最大肯定。”经过三年的不断迭代,他成功把《商业统计和数据科学》这门令人生畏的枯燥课程变成“爆款”。
在课程中,孙文光精心设计教学案例,深入浅出地介绍现代统计学思想和机器学习方法。他与商学院的同事们共同设计了一系列交叉课程,在一个课堂共同授课,教会学生如何综合运用数据科学、市场营销学和金融学的知识解决实际的商业决策问题。

“我一直对教学抱有极大的热情,这是我所从事职业的最大乐趣之一。”孙文光说,“我未来计划利用浙大的云平台办一些数据科学系列讲座,用深入浅出和通俗易懂的方式传播数据科学知识,让更多的人认识和喜爱这门学科。”
如今的数据科学中心,正面向全校本科生开放夏令营名额,未来的那个你,或许能够在这门理论与应用并进、前景无限的学科中找到毕生所爱。