《分布式机器学习:算法、理论与实践》

人工智能和大数据时代,解决最有挑战性问题的主流方案是分布式机器学习!为了帮助机器学习从业者更加深入地了解分布式机器学习领域的基本框架、典型算法、理论和系统,帮助大家在这个领域打下扎实基础,微软亚洲研究院机器学习核心团队撰写《分布式机器学习:算法、理论与实践》一书,全面介绍了分布式机器学习的现状,深入分析其中的核心技术问题,并且讨论该领域未来的发展方向。


由微软亚洲研究院机器学习核心团队潜心之作!鄂维南院士、周志华教授倾心撰写推荐序!


全书共12章。


第1章是绪论,向大家展示分布式机器学习这个领域的全景。


第2章介绍机器学习的基础知识,其中涉及到的基本概念、模型和理论,会为读者在后续章节中更好地理解分布式机器学习的各项技术奠定基础。


第3章到第8章是本书的核心部分,向大家细致地讲解分布式机器学习的框架,及其各个功能模块。其中第3章对整个分布式机器学习框架做综述,而第4章到第8章则针对其中的数据与模型划分模块、单机优化模块、通信模块、数据与模型聚合模块分别加以介绍,展示每个模块的不同选项并讨论其长处与短板。接下来的三个章节,是对前序内容的总结与升华。


其中第9章介绍了由分布式机器学习框架中不同选项所组合出来的各式各样的分布式机器学习算法。


第10章讨论了这些算法的理论性质(例如收敛性)。


第11章则介绍几个主流的分布式机器学习系统(包括Spark MLlib,Multiverso参数服务器系统,和TensorFlow数据流系统)。


最后的第12章是全书的结语,在对全书内容进行简要总结之后,着重讨论分布式机器学习这个领域未来的发展方向。