随着互联网、无线上网、物联网等网络新技术的迅猛发展,我们每个人都生活在一个充满数据的时代。大数据时代的到来全方位地颠覆了IT领域的系统开发和数据处理的应用。通用的数据库技术不能满足大数据可扩展和高容错的特殊需求;传统的数据管理的商业模式已不被日益增加的非盈利用户所接受。面对这些新的社会和市场的需求,新开发的大数据主流系统是以低成本的开源软件、云计算的模式出现的。本次课程邀请到美国俄亥俄州立大学计算机科学和工程系主任张晓东教授作为授课专家,课程内容围绕大数据处理的相关问题和前沿进展而展开。
注册类型 | 参会者身份 | 5月23日-7月22日 |
---|---|---|
截止2019年7月22日,CCF会员会龄满3个月的 | CCF会员 | 0.0 |
CCF学生会员 | 0.0 | |
截止2019年7月22日,CCF会员会龄不满3个月的 | CCF会员 | 1500.0 |
CCF学生会员 | 1500.0 | |
非CCF会员 | 2000.0 | |
非CCF会员(学生) | 2000.0 |
导论 | 新知Talk:后摩尔定律时代大数据处理的挑战和机遇 | 7.22 |
(1)计算机系统中的供求平衡 | ||
(2)一个大数据访问行为的分布模型 | ||
MapReduce以及数据处理 | (1)基本结构和Hadoop的开源实现 | 7.22 |
(2)Hive:在Hadoop上的数据仓库 | ||
(3)YSmart:优化Hadoop的数据处理 | ||
大数据对通用的数据结构的挑战 | (1)B+-Tree:快读慢写 | 7.23 |
(2)LSM-Tree:快写慢读 | ||
(3)快写快读的数据结构在哪儿呢? | ||
大数据在分布式系统上的存储结构 | (1)RCFile(或ORC):设计与实现 | 7.24 |
(2)存储结构中优化问题 | ||
(3)RCFile(或ORC)的应用范围 | ||
固态闪存系统 (Solid State Device Flash Memory) | (1)SSD Flash Memory的结构和性能 | 7.25 |
(2)SSD的并行性和它在整个存储系统中的作用 | ||
(3)Hystor:一个通用的混合型SSD的存储系统 | ||
(4)hStorage-DB:一个为数据库服务的混合型SSD的存储系统 | ||
数据处理中的并发控制 (Concurrency Control) | (1)“乐观控制”(OCC)在大数据分析中的弊端 | 7.26 |
(2)平衡的控制方法(既不乐观也不悲观)在哪儿呢? | ||
计算机学者发表论文之目的与追求 |