12.分布式计算框架-MapReduce-词频统计案例分区优化思路
MapReduce作为一种分布式计算模型,它主要用于解决海量数据的计算,就是“任务的分解与结果的汇总”。即使用户不懂分布式计算框架的内部运行机制,但只要能用Map和Reduce思想描述清楚要处理的问题,就能轻松地在Hadoop集群上实现分布式计算功能。本章主要介绍了MapReduce基本概念和编程模型简述,MapReduce实战演练,MapReduce词频统计案例,MapReduce工作原理解析等内容。
关键词: 词频统计
案例
分布式计算框架
主讲人:讲师 童金浩
时长:0:04:25
年代:2021年