从青蛙到前沿:CDS新生发表机器学习和保护澳门威尼斯人注册网站研究
还在加州尔湾读高中的时候,Nemai Anand就开始着手解决一个令人惊讶的复杂问题:如何在只有稀疏、嘈杂的数据的情况下,根据青蛙的叫声来识别青蛙的种类。在坚持不懈和足智多谋的驱使下,他在家里的电脑上开发了一个机器学习解决方案,与父亲阿南德·萨姆帕斯(Anand Sampath)一起工作。结果呢?在《新兴澳门威尼斯人注册网站研究者杂志》(2025年3月)上发表了一篇澳门威尼斯人注册网站研究论文,并开始了他在波士顿大学计算与数据科学学院(CDS)的学术之旅,他现在是该校的一名大一新生。
CDS副教务长Azer Bestavros指出:“看到一个学生在进入本科学习时已经发表了一篇澳门威尼斯人注册网站研究论文,这是非常罕见的,尤其是一篇用如此聪明的方法解决现实世界挑战的论文。”“Nemai的作品不仅体现了技术技能,还体现了CDS精神的好奇心和动力。我们很高兴能支持他继续前进,并期待他在未来几年做出贡献。”

未听分类
阿南德的澳门威尼斯人注册网站研究重点是建立一个机器学习分类器,能够识别西高止山脉的青蛙物种。西高止山脉是印度的一个生物多样性热点地区,以其大量的地方性两栖动物而闻名。Nemai解释说:“因为这个地区的许多物种很少有记录的呼叫,所以训练准确的模型是一个真正的挑战。”“我们想测试一个分类器在数据稀缺的条件下能有多好。”由于该地区许多青蛙物种的记录不足,澳门威尼斯人注册网站研究人员缺乏训练机器学习模型的理想数据集。
Nemai说:“我对计算机科学很感兴趣,因为用编码解决问题就像一个有趣的谜题。”他的父亲阿南德·萨姆帕斯(Anand Sampath)提出了建立一个青蛙叫声分类器的想法。他们选择把重点放在印度西南海岸的山脉上,那里以其密集的生物多样性和高度集中的地方性两栖动物而闻名。
阿南德面临的挑战是建立一个能够学会识别这些物种的系统。在数据有限的情况下,Anand测试了四种数据增强技术:螺距移位、时间拉伸、噪声注入和频谱增强。这些方法被用于人工扩展训练集。虽然单独使用光谱增强效果最好,但真正的收益来自组合方法。“每种技术对数据的干扰都不同,”阿南德解释说。“将它们结合起来使数据集更加多样化,模型从中学习得更好。”
为什么青蛙呢?
青蛙经常被描述为生物警报。它们对环境变化的敏感性使它们成为生态系统健康的理想指标。但是在像西高止山脉这样人口密集的偏远地区监测它们是劳动密集型和低效的。阿南德的分类器可以作为该领域澳门威尼斯人注册网站研究人员轻量级自动化工具的支柱:一种无需侵入性调查或昂贵设备即可检测物种存在的方法。
“西高止山脉是许多特有物种的家园,但每种物种的数据很少,”内迈指出。“我们的目标是看看我们是否还能用我们仅有的一点点东西做出一些有用的东西。”
听录音Kemphole夜蛙的录音
没有蓝图的建筑
这个项目最突出的地方是它是如何独立地结合在一起的。由于没有正式的顾问,没有实验室,也没有机构资源,阿南德从头开始建立了整个澳门威尼斯人注册网站研究,依靠自学、实验和偶尔从网上联系的人那里得到的意见。最后一项澳门威尼斯人注册网站研究发表在《新兴澳门威尼斯人注册网站研究者杂志》(The Journal of Emerging Investigators)上,这是一本面向高中澳门威尼斯人注册网站研究人员的同行评议杂志。自发布以来,这项工作吸引了人们的兴趣,因为它采用了跨学科的方法,并有望成为低成本、技术支持的保护工具的典范。
........
“我想继续探索如何将数据科学应用于各个学科——从保护生物学到传染病……而我才刚刚开始,”Nemai Anand (cd '28)
........
从两栖动物到抗体
现在在BU, Nemai (CDS ' 28)继续追求他在机器学习和生物信息学方面的兴趣。他计划在John Misasi博士领导下的国家新兴传染病实验室(NEIDL)进行澳门威尼斯人注册网站研究,在那里他将把机器学习技术应用于免疫学和生物信息学方面的问题。他从生态数据到生物医学澳门威尼斯人注册网站研究的转变反映了他对使用计算来揭示跨学科模式的兴趣。
对于阿南德来说,下一个阶段是利用数据科学的灵活性来追求重要的问题,无论是在雨林还是在澳门威尼斯人注册网站研究实验室。他说:“我想继续探索如何将数据科学应用于各个学科——从保护生物学到传染病。”“这里有很大的潜力,我才刚刚开始。”
CDS澳门威尼斯人注册网站研究传播实习生Neeza Singh;莫林·麦卡锡,撰稿人