博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Hive学习之七《 Sqoop import 从关系数据库抽取到HDFS》
阅读量:6969 次
发布时间:2019-06-27

本文共 1389 字,大约阅读时间需要 4 分钟。

一、什么是sqoop

  Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库(例如 :MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。

二、sqoop的特点

  Sqoop中一大亮点就是可以通过hadoop的mapreduce把数据从关系型数据库中导入数据到HDFS。

三、Sqoop import 命令

  将Mysql的jdbc驱动放在/opt/cloudera/parcels/CDH/lib/sqoop/lib目录下。

  如下图:

  

  参考学习网址:

  

  命令详解:

  1、基本语法

1 $ sqoop import (generic-args) (import-args)$ sqoop-import (generic-args) (import-args)

 

  2、基本命令

  查看网址:

  

  中的sqoop import的 Import control arguments

   

  3、案例

  方式一:

  将表rpt_sale_daily中数据导入到HDFS上。

  目标目录为:sqoop/rpt_sale_daily。

sqoop import --connect jdbc:mysql://master:3306/test \--username root --password 123456 --table rpt_sale_daily \--columns "dateid,huodong,pv,uv" \--where "dateid='2015-08-28'" \--target-dir sqoop/rpt_sale_daily \-m 1

  如果提示 sqoop/rpt_sale_daily 目录已经存在,执行:

hadoop fs -rmr sqoop/rpt_sale_daily

执行结果:如下图

20条数据成功导入,开始检测吧亲。

执行代码:

hadoop fs -cat sqoop/rpt_sale_daily/part-m-00000

数据如下图:

关系数据库表rpt_sale_daily里面的数据如下:

对比,数据相同,成功导入。

 方式二:

通过opt文件的方式传送:

新建test.opt文件:

1 import  2 --connect  3 jdbc:mysql://192.168.0.115:3306/test  4 --username  5 root  6 --password  7 123456  8 --table  9 rpt_sale_daily 10 --columns 11 "id,huodong,pvv,uvv" 12 --where 13 "id='2015-08-28'" 14 --target-dir 15 sqoop/rpt_sale_daily 16 -m 1

执行指令:

sqoop options-file test.opt

执行过程和结果和方式一一样。

转载于:https://www.cnblogs.com/invban/p/5385122.html

你可能感兴趣的文章
ecshop二次开发常用代码
查看>>
GCD编程 之 略微提高篇
查看>>
第十四章 数字签名算法--RSA
查看>>
Deep Learning for Nature Language Processing --- 第四讲(下)
查看>>
第一次打开Photoshop时的基本设置
查看>>
讲座:计算机专业及其学习
查看>>
CentOS 7 启动、重启、chkconfig等命令已经合并为systemctl
查看>>
POI 中的CellRangeAddress 参数
查看>>
Http Request
查看>>
Map集合中value()方法与keySet()、entrySet()区别 《转》
查看>>
Thrift反序列化导致OOM(转)
查看>>
自定义用户登录,会话保持,登录后自动跳转原页面
查看>>
Quartz的cronTrigger表达式
查看>>
李洪强经典iOS面试题11
查看>>
知乎上关于游戏引擎的讨论
查看>>
解决:error: Cannot fetch repo (TypeError: expected string or buffer)
查看>>
oracle 11g RAC 的一些基本概念(三)
查看>>
api数据接口
查看>>
买房的贷款时间是否是越长越好?https://www.zhihu.com/question/20842791
查看>>
maven整合S2SH
查看>>