b2科目四模拟试题多少题驾考考爆了怎么补救
b2科目四模拟试题多少题 驾考考爆了怎么补救

sql语句面试常见问题课程一、大数据运维之Linux基础 本

电脑杂谈  发布时间:2018-02-13 22:33:32  来源:网络整理

sql的面试题_sql语句面试常见问题_sql删除语句

课程一、大数据运维之Linux基础

本部分是基础课程,帮大家进入大数据领域打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,Spark,Storm,docker,openstack等众多课程。因为企业

中的项目基本上都是使用Linux环境下搭建或部署的。

1)Linux系统概述

2)系统安装及相关配置

3)Linux网络基础

4)OpenSSH实现网络安全连接

6)用户和用户组管理

7)磁盘管理

8)Linux文件和目录管理

9)Linux终端常用命令

10)linux系统监测与维护

课程二、大数据开发核心技术 - Hadoop 2.x从入门到精通

本课程是整套大数据课程的基石:其一,分布式文件系统HDFS用于存储海量数据,无论是Hive、HBase或者Spark数据存储在其上面;其二是分布式资源管理框架

YARN,是Hadoop 云操作系统(也称数据系统),管理集群资源和分布式数据处理框架MapReduce、Spark应用的资源调度与监控;分布式并行计算框架

MapReduce目前是海量数据并行处理的一个最常用的框架。Hadoop 2.x的编译、环境搭建、HDFS Shell使用,YARN 集群资源管理与任务监控,MapReduce编

程,分布式集群的部署管理(包括高可用性HA)必须要掌握的。

一、初识Hadoop 2.x

1)大数据应用发展、前景

2)Hadoop 2.x概述及生态系统

3)Hadoop 2.x环境搭建与测试

二、深入Hadoop 2.x

1)HDFS文件系统的架构、功能、设计

2)HDFS Java API使用

3)YARN 架构、集群管理、应用监控

4)MapReduce编程模型、Shuffle过程、编程调优

三、高级Hadoop 2.x

1)分布式部署Hadoop 2.x

2)分布式协作服务框架Zookeeper

3)HDFS HA架构、配置、测试

4)HDFS 2.x中高级特性

5)YARN HA架构、配置

6)Hadoop 主要发行版本(CDH、HDP、Apache)

四、实战应用

1)以【北风网用户浏览日志】数据进行实际的分析 2)原数据采集 3)数据的预处理(ETL) 4)数据的分析处理(MapReduce)

课程三、大数据开发核心技术 - 大数据仓库Hive精讲

hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行

运行。其优点是学习成本低,可以通类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

一、Hive 初识入门

1)Hive功能、体系结构、使用场景

2)Hive环境搭建、初级使用

3)Hive原数据配置、常见交互方式

二、Hive深入使用

1)Hive中的内部表、外部表、分区表

2)Hive 数据迁移

3)Hive常见查询(select、where、distinct、join、group by)

4)Hive 内置函数和UDF编程

三、Hive高级进阶

1)Hive数据的存储和压缩

2)Hive常见优化(数据倾斜、压缩等)

四、结合【北风网用户浏览日志】实际案例分析

1)依据业务设计表

2)数据清洗、导入(ETL)

3)使用HiveQL,统计常见的网站指标

课程四、大数据协作框架 - Sqoop/Flume/Oozie精讲

Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的(mysql、postgresql…)间进行数据的传递,可以将一个关系型(例如 : MySQL


本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/tongxinshuyu/article-76174-1.html

相关阅读
    发表评论  请自觉遵守互联网相关的政策法规,严禁发布、暴力、反动的言论

    • 无名女鬼
      无名女鬼

      没有发财的

    • 冯伉
      冯伉

      日本鬼子几次都是在赌国运而已

      • 朱子厚
        朱子厚

        更不能剥夺狗叫的权利

    热点图片
    拼命载入中...