利用自然语言处理理解和识别风险
作为某中心的应用科学经理,Muthu Chandrasekaran致力于开发新工具来自动化并构建风险技术。
推动Muthu Kumar Chandrasekaran对科学感兴趣的因素之一是其造福社会的潜力。在新加坡国立大学攻读博士学位期间,他致力于将自然语言处理应用于在线讨论论坛,旨在帮助大规模开放在线课程(MOOC)的教师。MOOC的教师团队规模小,却要面对数十万使用讨论板分享问题和评论的学生。Chandrasekaran开发了模型来提醒教师关注需要他们注意的重要对话。
“能够让系统学习的事实让我着迷……我希望以能够惠及整个社会的方式应用这项技术。”
如今,他是某中心的应用科学经理,领导一个科学家团队,通过分析某中心团队正在开发的新技术产品的机器学习模型来识别风险。目标是在产品发布前识别可能对客户体验产生负面影响的潜在问题。
他对科学的热情可以追溯到早年。尽管在印度金奈长大时家里没有电脑,但编程是学校课程的一部分。大约在九年级时,他开始学习C编程语言。
“我花了一年时间才理解为什么要学习编程。但到了十一年级,我已经明白了为什么要编写程序以及它们的作用。”这最终促使他攻读计算机科学与工程的学士学位。
在大学三年级,他选修了一门人工智能入门课程。“能够让系统学习的事实让我着迷。我肯定对机器学习产生了兴趣,我想如果我要读研究生,这就是我要做的事情,”Chandrasekaran说。“我希望以能够惠及整个社会的方式应用这项技术。”
处理科学文献
Chandrasekaran在开始新加坡国立大学的硕士学位之前,曾在印度IT行业工作过几年。在那里他首次了解了自然语言处理(NLP)。他的论文专注于社交网络分析和从科学文献中提取信息。他的研究问题之一是如何自动处理科学论文以提取有用信息,例如通过分析科学家之间的合作活动。
“科学文献的自动处理不是奢侈,而是必要,”Chandrasekaran说。以医学和生物医学研究为例,每天都有大量论文发表,使得医生和其他健康专业人员很难跟上医学文献的步伐。
在攻读硕士和博士学位期间,他在科学文献方面的工作使他在西雅图的Allen人工智能研究所获得实习机会,在那里他参与了一个名为Semantic Scholar的搜索引擎的开发。那次实习为他在美国打开了研究和行业机会。
在某中心探索不同路径
就在这时,Alexa团队的某中心招聘人员联系了他。2019年,他加入了Alexa设备团队,致力于为Alexa的自然语言理解模型进行用户数据的大规模训练,随后转至某中心云服务Amazon Comprehend团队,该团队提供一套NLP服务,从文档文本中挖掘有价值的见解。
在那里,他有机会与某中心学者、哥伦比亚大学计算机科学教授Kathleen McKeown一起指导应用科学实习生。“我每周指导实习生发表论文的会议是我最享受的经历。事实上,我们在EACL 2021成功发表了一篇论文。”
2021年,Erwin Cornejo联系了他,Cornejo领导一个由科学家、软件工程师、UI/IX设计师、产品经理、风险经理和经济学家组成的初创团队,专注于使用NLP构建企业应用程序和机器学习服务。Cornejo的团队正在寻找具有信息检索和摘要背景的NLP专家。“他有一些非常有趣且具有潜在影响力的想法,”Chandrasekaran说。这方面,加上领导团队的机会,激发了他的兴趣。
理解和识别风险
Chandrasekaran接受了挑战,如今领导风险科学团队,该团队是客户体验与业务趋势(CXBT)组织的一部分。CXBT包含多个某中心业务,致力于深入理解和改善全球客户体验。
“整个风险分析领域基本上是关于预测或预报可能出错的事情,”他解释道。他的团队专注于影响客户信任和体验的风险。“在某中心,客户信任至关重要。某中心的领导原则之一是以客户为中心,因为一旦客户信任被破坏,就很难重新赢得。”
他的团队主要项目是一个机器学习模型,该模型基于以往产品错误的数据集,预测新产品可能出现的潜在问题。该模型可在构思阶段或产品即将发布时应用。
“只要提供描述,我们的模型就能分析这些内容作为输入,并搜索错误修正数据库。然后模型将提炼出在您正在构建的产品类似的某中心产品中发生的以往错误和故障实例。”
他的团队继续改进模型,并计划扩展数据源,包括与影响其他公司的故障、黑客攻击、安全漏洞以及其他问题和错误相关的公共信息。
“我团队的应用科学家拥有自然语言处理、计算语言学或信息检索等人工智能领域的博士或硕士学位,”Chandrasekaran解释说。“实习生是具有类似背景的博士或硕士生。他们都对人工智能及其在风险领域产生的影响充满热情。”
推动研究领域发展
Chandrasekaran在某中心工作最欣赏的一点是NLP在各个某中心组织中的广泛应用。这些广泛的应用意味着从事NLP工作的吸引力也在扩大。
Chandrasekaran指出,许多数据科学家正在转向NLP,通过公司的机器学习大学课程学习必要技能。“我感谢某中心为提高自然语言处理人才库而采取的这项举措。他们不仅使某中心受益,实际上也使整个行业受益。”
这种扩展研究益处的关注与Chandrasekaran产生共鸣。作为计算语言学协会(ACL)滚动评审倡议的区域主席,他管理着20多名评审员,每月评审数篇关于NLP的科学论文,推荐ACL是否应接受它们发表。“我很高兴被邀请并乐于成为这个社区的一部分。”
对于希望从事类似职业的年轻科学家或学生,Chandrasekaran建议不要专注于已经很大的研究领域。
他认为研究人员刚刚开始探索NLP的可能性。“你应该专注于NLP尚未产生影响的领域,特别是那些能够造福社会的领域,”他说。“机会来自尚未解决的问题。那就是你的热情所在。”
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
公众号二维码
公众号二维码