博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
在Alluxio上运行Apache Hive
阅读量:4119 次
发布时间:2019-05-25

本文共 413 字,大约阅读时间需要 1 分钟。

™ 数据仓库软件使用SQL,方便读取、写入和管理驻留在分布式存储中的大型数据集。结构可以投影到已经存储的数据上。提供了一个命令行工具和JDBC驱动程序来将用户连接到Hive。我们都知道,Hive作为数据仓库工具,传统文件数据处理大都是搭配Hadoop使用。此处将描述如何搭配内存加速使用,让你的批处理任务速度飞起来。

本节将使用apache-hive-3.1.2与alluxio2.3|2.4结合,验证数仓功能使用。

1.Hive部署

1.1.前期准备

先下载Hive-3.2.1版本,如果你需要在Hadoop MapReduce上运行Hive(简单使用时,可以不安装hadoop),hive安装只需要在hadoop的master节点安装即可。当然也可以使用Spark SQL作为处理引擎,有关这部分将在后续章节呈现。

在这里插入图片描述

1.2.配置Hive

添加以下配置项到你的Hive安装目下的conf目录里的hive-env.sh文件中:

转载地址:http://ujcpi.baihongyu.com/

你可能感兴趣的文章
tp5封装通用的修改某列值
查看>>
laravel控制器与模型名称不统一
查看>>
vue登录拦截
查看>>
npm配置淘宝镜像仓库以及electron镜像
查看>>
linux设置开机自启动脚本的最佳方式
查看>>
VUE SPA 单页面应用 微信oauth网页授权
查看>>
phpstorm 集成 xdebug 进行调试
查看>>
npm和node升级的正确方式
查看>>
laravel事务
查看>>
springcloud 连续请求 500
查看>>
vue复用新增和编辑表单
查看>>
Ubuntu 16.04 apt-get更换为国内阿里云源
查看>>
laravel部署到宝塔步骤
查看>>
小程序获取access_token
查看>>
navicat远程连接mysql数据库
查看>>
tp5令牌数据无效 解决方法
查看>>
自己的网站与UCenter整合(大致流程)
查看>>
laravel 制作通用的curd 后台操作
查看>>
【小红书2017年笔试】求一个数组中平均数最大的子数组
查看>>
Linux基础系列-定时器与时间管理
查看>>