小型:具有可分离潜在结构的学习混合隶属关系模型:理论、可证明的有效算法和应用
赞助单位:美国国家科学基金会
奖励编号:1527618
PI: Prakash Ishwar
联合主管:Venkatesh Saligrama
文摘:在科学和工程领域的广泛问题中,包括高光谱成像、基因表达分析和代谢网络,观察到的数据是高维的,并且是由一小部分未知的共同潜在原因的未知随机混合产生的。能够从观察到的数据中成功有效地识别潜在原因不仅对科学理解很重要,而且对有效的数据表示和决策也很重要。这类问题的流行算法利用近似和启发式来计算可跟踪性。因此,这些算法的一致性或效率保证要么非常弱,要么根本不存在。本澳门威尼斯人注册网站研究涉及从具有可证明的统计和计算效率保证的高维数据中学习潜在原因模型的算法的开发。
本澳门威尼斯人注册网站研究的关键是共享潜在因素的自然可分离性。每个潜在因素的特征分量的存在,该特征分量由流行方法产生的估计值近似满足。本澳门威尼斯人注册网站研究旨在证明近似可分性不仅是混合隶属度潜因子模型的一种自然而方便的结构性质,而且实际上是高维的必然结果。本澳门威尼斯人注册网站研究还涉及开发一套可证明一致的、统计和计算效率高的算法,通过适当地利用由特征分量引起的几何形状来解决各种混合成员潜在因子问题。关键的洞察力是将每个潜在因素的特征部分识别为合适空间中的极值点。这可以通过适当定义的随机投影有效地完成。基于随机投影的算法自然适用于低通信成本的分布式实现,这对于web规模的分布式数据挖掘应用程序具有吸引力。
更多信息请点击这里。