首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏Netkiller

    Apache Hive 快速入门

    HIVE_HOME/bin EOF cat >> ~/.bash_profile <<'EOF' export JAVA_HOME=/srv/java export HADOOP_HOME=/srv/apache-hadoop [root@localhost ~]$ su - hadoop [hadoop@localhost ~]$ /srv/apache-hadoop/bin/hdfs dfs -mkdir -p /user /hive/warehouse [hadoop@localhost ~]$ /srv/apache-hadoop/bin/hdfs dfs -mkdir -p /tmp/hive [hadoop@localhost ~]$ /srv/apache-hadoop/bin/hdfs dfs -chmod g+w /user/hive/warehouse [hadoop@localhost ~]$ /srv/apache-hadoop 访问 Hive 启动 Hadoop [hadoop@localhost ~]$ /srv/apache-hadoop/sbin/start-all.sh This script is Deprecated

    1.3K80发布于 2018-03-05
  • 来自专栏Jed的技术阶梯

    Sqoop安装

    @hadoop01 conf]$ vim sqoop-env.sh # 在hadoop的cdh版本中,把4个组件(commom、hdfs、mapreduce、yarn)安装到4个不同的目录中 # 而apache-hadoop 的4个组件都在一个目录下 # 根据自己的版本配置这里的环境变量,我是apache-hadoop,所以都用HADOOP_HOME即可 export HADOOP_COMMON_HOME=/home/hadoop

    93940发布于 2018-09-13
  • 来自专栏操作系统实验

    hadoop-3.1.3 cluster setup on linux

    dfs -put ~/alice.txt /test-path hdfs dfs -ls /test-path more ops, view https://sparkbyexamples.com/apache-hadoop

    1K70编辑于 2023-11-04
  • 来自专栏民工哥技术之路

    进击大数据系列(六):Hadoop 分布式计算框架 MapReduce

    /本地测试,正式环境需要注释掉// Date date = new Date();//保证输出的目录不重复 args = new String[]{"D:\\ideawork\\bigdata\\apache-hadoop \\src\\main\\resources\\mapreduce\\input\\word.txt", "D:\\ideawork\\bigdata\\apache-hadoop\\src\\main /本地测试,正式环境需要注释掉// Date date = new Date();//保证输出的目录不重复 args = new String[]{"D:\\ideawork\\bigdata\\apache-hadoop \\src\\main\\resources\\mapreduce\\input\\word.txt", "D:\\ideawork\\bigdata\\apache-hadoop\\src\\main

    1.8K10编辑于 2023-08-22
  • 来自专栏Hadoop实操

    Livy,基于Apache Spark的开源REST服务,加入Cloudera Labs

    Hadoop生态圈的Spark(https://www.cloudera.com/products/open-source/apache-hadoop/apache-spark.html),一夜之间成为默认的数据处理引擎

    2.7K80发布于 2018-03-29
  • 来自专栏Pandolar个人学习

    大数据_Hadoop初体验

    https://www.cloudera.com/products/open-source/apache-hadoop/key-cdh-components.html Hortonworks

    1.3K40编辑于 2022-01-04
  • 来自专栏黑泽君的专栏

    大数据技术之_18_大数据离线平台_01_项目开发流程+大数据常用应用/分析平台/业务处理方式+数据分析平台的数据来源+数据处理的流程+项目集群的规模+需求分析+技术架构/选型

    3、容量调度器:CapacityScheduler.class,这是 Apache-HADOOP 默认的调度。   

    1.9K40发布于 2019-04-22
领券