在从oracle导入到配置单元的sqoop导入后,我在配置单元中得到空行
在sqoop --query中,我提到了where pk is not null。
sqoop查询:
sqoop import \
--connect "${SQOOP_CONN_STR}" \
--connection-manager "${SQOOP_CONNECTION_MANAGER}" \
--username ${SQOOP_USER} \
--password ${SQOOP_PASSWORD} \
--fields-terminated-by ${SQOOP_DELIM} \
--null-string '' \
--null-non-string '' \
--query \""${SQOOP_QUERY}"\" \
--target-dir "${SQOOP_OP_DIR}" \
--split-by ${SQOOP_SPLIT_BY} \
-m ${SQOOP_NUM_OF_MAPPERS} 1> ${SQOOP_TEMP_LOG} 发布于 2017-05-04 14:07:40
这是由于字段分隔符的更改造成的。
您正在未指定任何字段分隔符的情况下在HDFS中导入。因此,它将使用默认逗号。
您创建的配置单元表格可能使用CTRL^A(默认)作为字段分隔符。
使这些同步,它应该可以工作。
https://stackoverflow.com/questions/43743935
复制相似问题