
Avinash汉
计算机科学助理教授
Mohan博士在强化学习、机器学习和计算机网络方面拥有十多年的经验,他的澳门威尼斯人注册网站研究重点是统计学习,包括强化学习、在线学习(多臂强盗问题)、博弈论和凸优化。主要澳门威尼斯人注册网站研究方向为计算机网络与通信,包括排队论、随机过程、信息论、资源分配和网络控制。他曾在波士顿大学(获得2022-2023年度杰出教育学者奖学金)、密歇根大学和以色列理工学院(获得PBC奖学金)担任博士后。他是2018年IEEE国际计算机通信会议(Infocom)最佳演讲奖(MAC层轨道)的获得者。
澳门威尼斯人注册网站研究兴趣
- 强化学习
- 统计学习理论
- 随机控制
- 随机对策(竞争马尔可夫决策过程)
- 放松管制的市场设计
- 通信网络优化
课程
- 使用Python的信息结构
- 数据科学与Python
学术作品
预印本和技术报告
F. Fayza, C. Demirkiran, C. Chen, C. Liu, A. Mohan, H. Errahmouni, S. Yun, M. Imani, D. Zhang, D. Bunandar和A. Joshi。“利用光子学实现高效的超维计算”(2023)。https://arxiv.org/pdf/2311.17801
Zaki, M, Mohan, A, Gopalan, A, and Mannor, S.“基于演员评论家的不当强化学习”(2022)。
Zaki, M., Mohan, A.和Gopalan, A.,“基于无悔学习的线性强盗改进纯探索”(2021)。https://doi.org/10.13140/RG.2.2.35458.20162
Mohan, A, Vatsa, S., Kumar, A.和Chattopadhyay, A.“低延迟物联网应用中减少状态信息交换的分散混合MAC设计”(2021)。https://arxiv.org/pdf/2105.11213
Zaki, M, Mohan, A, Gopalan, A, and Mannor, S.“基于梯度的不当学习策略优化”(2021)。https://arxiv.org/abs/2102.08201
Mohan, A., Mannor, S.和Kizilkale, A.,“澳门威尼斯人注册最优控制策略的波动性和一类线性二次型调节器的容量”(2020)。https://arxiv.org/pdf/2002.06808
Zaki, M, Mohan, A和Gopalan, A.“使用无遗憾学习者的线性强盗中的显式最佳手臂识别”(2020)。https://arxiv.org/pdf/2006.07562
Mohan, A, Gopalan, A, and Kumar, A.“一类排队系统的单比特状态反馈吞吐量最优分散调度”(2020)。https://arxiv.org/pdf/2002.08141
Zaki, M, Mohan, A.和Gopalan, A.“在线性土匪中实现最优和有效的最佳手臂识别”(2019)。https://arxiv.org/abs/1911.01695
会议论文
Zaki, M, Mohan, A, Gopalan, A, and Mannor, S.“基于不当强化学习的演员评论家”。第39届国际机器学习会议(ICML)论文集,《机器学习澳门威尼斯人注册网站研究论文集》vol. 162 (July 17-23, 2022): 25867-25919。https://proceedings.mlr.press/v162/zaki22a/zaki22a.pdf
Zaki, M., Mohan, A.,和Gopalan, A.,“使用无遗憾学习器的线性强盗的明确最佳武器识别”。国际人工智能会议(IJCAI-ECAI), 2022。https://arxiv.org/pdf/2006.07562
Zaki, M, Mohan, A, Gopalan, A, and Mannor, S.“基于不当强化学习的演员评论家”。强化学习与决策多学科会议(RLDM), 2022。
Zaki, M.、Mohan, A.、Gopalan, A.和Mannor, S.《比最好的更好:基于梯度的网络调度不当强化学习》.“网络和队列中的强化学习研讨会,ACM SIGMETRICS, 2021。https://arxiv.org/pdf/2105.00210
Mohan, A, Mannor, S, and Kizilkale, A. C.“一类线性二次型调节器的最优控制策略的波动性”.2021年美国控制会议(ACC), 2021。https://arxiv.org/pdf/2002.06808
Vatsa, S., Mohan, A.和Kumar, A.,“在IEEE 802.15.4网络中,在Contiki操作系统下实现超过6TiSCH的QZMAC(分散延迟最优MAC)”。国际通信系统与网络会议(COMSNETS)的演示和展览研讨会,2021。亚军,最佳澳门威尼斯人注册网站研究演示奖。https://arxiv.org/pdf/2012.02955
Zaki, M., Mohan, A.,和Gopalan, A.,《运用无悔学习者进行线性强盗的纯粹探索》第34届神经信息处理系统(NeurIPS)会议机器学习优化研讨会,2020。被选为重点报道演讲。
Zaki, M., Mohan, A.,和Gopalan, A.,“在线性盗匪中走向最优和有效的最佳武器识别”。第33届神经信息处理系统会议(NeurIPS), 2019,加拿大,温哥华。
Mohan, A, Gopalan, A, and Kumar, A.“无线数据采集网络的简化状态、最佳介质访问控制”。IEEE计算机通信国际会议(INFOCOM), 2018。最佳演讲奖。
Mohan, A., Chattopadhyay, A.和Kumar, A.,“用于低延迟调度的混合MAC协议”。IEEE移动自组织和传感器系统国际会议(IEEE MASS), 2016。IEEE CompSoc学生旅行奖。
Mohan, A,和Hari, K. V. s,“通道缩短均衡器的低复杂度适应”。第54届国际电路与系统研讨会(MWSCAS), 2011
期刊论文
Mohan, A, Chattopadhyay, A, Vatsa, S. V和Kumar, A.“物联网应用的低延迟MAC:无显式状态信息共享的分散最优队列调度。”网络系统控制学报(2008):1-12。https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=10584286
Mohan, A., Gopalan, A.和Kumar, A.,“一类无线网络的分散媒体访问控制的减少状态、最优调度”。IEEE/ACM网络学报28日,没有。3(2020): 1017-1032。https://ieeexplore.ieee.org/abstract/document/9078869
Mohan, A,和Hari, K. V. s,《SISO信道缩短均衡器的低复杂度适应》。国际电子与通信杂志,第66期。8(2012): 600-604。https://doi.org/10.1016/j.aeue.2012.03.011