解决数据科学多样性的迫切需要
任何一项现代技术的功效,在很大程度上都是由其创建过程中的数据状态决定的。工程师和开发人员依靠分析人员提取的数据洞察力来指导他们构建实际满足需求的解决方案。随着人工智能工具的稳步崛起,数据的影响将很快超越人类的工作能力。
但是,如果没有一系列不同的见解来指导为世界各地的人们建立的产品和服务,这种规模往好了说可能是徒劳的,往坏了说可能会适得其反。
数据科学是跨行业创新不可或缺的一部分,这一点从其快速增长的市场机会可以看出。但随着这一领域的扩大,它的人口不平等也在扩大。数据的价值取决于构成它的信息集和全面解释它所必需的视角的多样性。如果没有各种各样的见解来描绘整个图景,任何数据集的潜力都非常有限。
Srujana Kaddevarmuth(如图),埃森哲有限责任公司数据科学和分析主管,机器学习女性大使;在班加罗尔的数据科学团队,通过行业内一些最有影响力的公司的主要工程和分析部门,亲眼观察到了同质化数据团队的低效影响。现在,数据科学家正在努力实现数据协作的多样化。
“数据科学是一个高度跨学科的领域,”Kaddevarmuth说。“这需要来自不同学科的人聚在一起,从不同的角度来看问题,(然后)提出最友好、最优的解决方案。”
在斯坦福大学最近举行的“斯坦福女性数据科学”活动上,Kaddevarmuth采访了SiliconANGLE Media移动直播工作室的主持人Lisa Martin。本周,该机构的科技女性专题聚焦了斯鲁贾纳·卡德瓦姆斯(Srujana Kaddevarmuth)。
Kaddevarmuth在科技行业的职业生涯开始时是一名工程师,之后在埃森哲(Accenture)、惠普(Hewlett-Packard)和谷歌等科技巨头担任高级分析领导职务,积累了十多年的数据经验。由于对该领域在过去几年的爆炸式增长有一个全面的视角,数据科学家对数据科学的技术方面感兴趣,因为她正在改进其包容性的工作。
Kaddevarmuth对团队合作的热情将她吸引到了WiDS,在那里她发现了对多元合作的类似承诺。该项目在全球的存在给她留下了深刻印象,激励她通过该项目更直接地参与数据科学公平。
“我关心数据科学,但也关心女性和性别少数群体在太空中的准确表现,”她说。“WiDS正在全球产生重大影响。”
除了提高代表性,WiDS还致力于支持新的数据科学家,因为该组织建立了一系列技能来将其带入快速增长的行业。该节目举办了一个数据马拉松,以鼓励团队建设,并说明不同观点的必要性,以一个普遍的解决方案。
“数据马拉松……帮助年轻的数据科学爱好者磨练所需的数据科学技能集,也帮助数据科学从业者提高和维持他们的技能集,”Kaddevarmuth说。
数据科学的多样性至关重要,Kaddevarmuth正在与WiDS合作,以培育一个将包容作为积极优先事项的社区。这位数据科学家和她的团队发现,在使用具有竞争力的数据分析平台Kaggle时,男性的排名始终高于女性,尽管当地女性人才占优势,但她们发现,男性在这方面的排名一直高于女性。
她说:“我们的研究表明,男性在Kaggle的排行榜上占据了主导地位……在整个印度,尽管该地区拥有杰出的女性顶尖科学家……拥有多项专利、出版物和创新。”
根据Kaggle的2017年“数据科学和机器学习状态”调查,2017年,女性在所有平台受访者中只占16%。Kaddevarmuth发现,女性数据科学家面临的挑战主要源于缺乏建立网络的机会,从而使合作解决问题成为可能。妇女在男性占主导地位的环境中被无意识地排除在外,因此在提供解决办法方面得到的支持不如男性。
Kaddevarmuth和她的团队通过设计一个内建的以网络为重点的WiDS研讨会来鼓励合作,以此来对抗这种循环。该计划还包括指导元素,以帮助参与者通过任何潜在的障碍。
Kaddevarmuth说:“导师与各自的团队合作,为他们提供必要的指导、指导和辅导,以帮助他们完成数据马拉松之旅。”
WiDS Bengaluru活动吸引了超过110人参加,并成功地建立了联系,Kaddevarmuth预测,这种联系将在Datathon之后继续存在。数据科学家将整个团队的学习和过程管理计入了计划的最高成就。
Kaddevarmuth说:“在我看来,能够合作、从不同的角度看问题、尽管面临很多挑战仍能提交代码,以及导航这个平台本身就是一项不错的成就。”
改善数据分析的社会元素既是一种道德追求,也是一种实用的商业解决方案。Kaddevarmuth说,同理心和分析一样重要,在看到整体数据图并解决其中的挑战时。
“合作是关键,”她说。“你需要不同的人聚在一起,看看问题,然后……解决挑战。”不同的视角是数据科学领域搜索成功的关键。”
对于整个行业来说,在人口统计方面的改进已经不是什么秘密了。谷歌公司(google LLC)、亚马逊公司(Amazon.com Inc.)和facebook Inc.等公司都表示将致力于促进多元化,但为提高包容性而采取的招聘和留住措施收效相对较小。除了在道德上是必要的,多样化的团队对产品的功效和底线有明显的积极影响。
该行业的目标是填补490,000个新的数据科学岗位,由Kaddevarmuth和WiDS牵头的项目确保该领域朝着正确的方向发展。
“数据科学作为一个领域正在以闪电般的速度发展。我们……在不久的将来拥有解决人类面临的几乎所有挑战的办法,”Kaddevarmuth说。但要想出最友好、最可持续的解决方案……必须实现这一领域的多样性。”