《Spark简介》

课程简介 . . .

Spark作为下一代in memory MR计算框架,比基于磁盘的MR框架在性能上有了数量级的提升。此外,Spark可以统一支持Batch Query,Interactive Query,Streaming,Graph等计算模型,大大提高了集群资源的复用率。

Spark正式加入了Apache开源项目,其核心技术团队组建公司DataBricks,和Cloudera建立战略合作关系,势头不容小觑。

议程:

20131219 周四

20:00-21:00主题讲座

21:00-21:30问答互动

 

议题:

  • spark概述
  • spark核心组件
  • spark编程接口
  • spark任务调度
  • 总结

 

主讲人:  

新浪微博:@CrazyJvm

计算机硕士,近年来一直专注于分布式计算与机器学习相关领域。

国内较早的Spark研究与使用者,并且也是Scala爱好者。

......

(展开全部)

课程标签 . . .

spark(12) hadoop(6) 大数据(5)

同学们的推荐 . . .

课程还没有推荐语

同学们的笔记 . . .

00:26:40 / 课时1 有用(0)
partition可以视为一个文本文件中的一行记录吗? - 双手换挡
00:18:42 / 课时1 有用(0)
SER=serialization - 穿马甲的小样
全部2篇笔记

课程问答 . . .

全部2个回答

学校里学不到的,都在多贝公开课

快来吧,现在就加入多贝!

同学们 . . .

175人正在学  /  0人学过