首页
学习
活动
专区
圈层
工具
发布
    • 综合排序
    • 最热优先
    • 最新优先
    时间不限
  • 来自专栏桥路_大数据

    产品图鉴:Greenplum

    Greenplum是老牌的MPP数据仓库,查询稳定性很强,SQL支持非常全面(支持ANSI SQL 2008和SQL OLAP 2003扩展;支持ODBC和JDBC应用编程接口。 ,基于PostgreSQL构建而成,主要面向结构化数据OLAP计算,Greenplum在6.0版本大大的提高了对OLTP的支持,tpcb性能提升60倍,单节点查询达到80000TPS(Transactions Greenplum 6.0版本引入了更多的开源组件,包括Kubernetes和Apache MADlib等,还增强了对云计算环境的支持。 其实运维问题,是MPP数据仓库常见的问题,Greenplum相对明显。 所以总结起来,Greenplum是一个老牌MPP数据仓库,整体比较均衡,适合中小规模数据的OLAP分析(MPP数据库在架构上注定会有扩展上限),在6.0版本之后,能够同时支持OLTP处理,成为OTAP数据仓库

    73440编辑于 2023-10-16
  • 来自专栏Hadoop数据仓库

    Greenplum修改hostname

    address='更改之后的主机名' where hostname='更改之后的主机名'; \q # 关闭GP Master gpstop -m # 启动GP gpstart -a 参考:【GREENPLUM

    96050编辑于 2022-11-02
  • 来自专栏Greenplum

    Greenplum高级使用

    9 Greenplum高级使用 9.1 常用查询语句 9.1.1 查看表的数据分布情况 stagging=#  select gp_segment_id,count(1) from  tablename errmsg | text | --错误信息 rawdata | text | --整行数据 rawbytes | bytea | --行大小 Distributed randomly 详细的说明请查看:Greenplum ----------------------------------------------------------- -------------------  PostgreSQL 8.3.23 (Greenplum PQO version 2.75.0 (9 rows) Time: 17.226 ms 9.3.2 名词解释 t_person4insert3 : 索引的名字,说明此查询已经使用索引了 slice: Greenplum segment: 每个sdw中设置两个primary(greenplum安装时gpinitsystem使用的文件中设置),所以看到的segment是48。

    1.7K10发布于 2019-01-28
  • 来自专栏Greenplum

    Greenplum迁移指南

    Greenplum迁移指南 目录 Greenplum迁移指南 1 目 1 录 1 第一节 Greenplum数据迁移方法论 2 1.1 为什么要进行数据迁移 2 1.2 迁移整体的流程 2 第二节 Greenplum 2、性能:Greenplum相对传统关系型数据库有明显的性能提升,多个用户从Oracle迁移到Greenplum后,性能有几十倍的提升。 ,迁移至Greenplum性能在同一量级,但因为数据节点交互延迟会略有增加 并发数据加载场景 1秒以内 可以迁移至Greenplum,需要将逐笔插入操作改为微批量插入,由于Greenplum MPP架构的优势 ,会导致性能有较大的损失,甚至无法满足业务的需求,请关注Greenplum的研发进展和新版本性能,Greenplum社区正在不断增强高并发事务性特性。 第四节PostgreSQL到Greenplum的数据迁移 5.1 一种平滑的解决方案 Greenplum与PostgreSQL无论在语法还是使用方式上,都基本上相似,所以从PostgreSQL迁移到Greenplum

    2.3K30发布于 2021-01-27
  • 来自专栏大数据生态

    Greenplum 操作锦囊

    背景在大数据领域,Greenplum 是一个广泛使用的开源数据仓库工具,特别受到数据分析师、数据科学家和企业的青睐,因为它能够提供高效、高性能的数据分析功能。 然而,掌握 Greenplum 的操作技巧并非易事,为了让用户更快速地掌握这些技巧,本文将为您提供 Greenplum 操作的锦囊妙计。 希望通过本文,您能够快速熟悉 Greenplum,提升工作效率和数据分析能力。查询类1. 启停在master节点上的install目录export MASTER_DATA_DIRECTORY=/data/greenplum/master/gpseg-1停止gpstopgpstop -M fast /gpactivatestandby -d /data/greenplum/master/gpseg-16.

    2K133编辑于 2023-11-08
  • 来自专栏光城(guangcity)

    GreenPlum内核升级

    最近在研究pg14的create table like语句,如下命令会被拆分成若干个statement,在greenplum中QD与QE的处理还不一样,会将statement从QD分发到各个QE上。

    1.5K10编辑于 2022-12-02
  • 来自专栏数据库相关

    Greenplum 5.16.0初探

    set-hostname dw-greenplum-2 hostnamectl set-hostname dw-greenplum-3 hostnamectl set-hostname dw-greenplum -1 mdw 192.168.2.12  dw-greenplum-2 sdw1 192.168.2.13  dw-greenplum-3 sdw2 192.168.2.14  dw-greenplum 配置 hostlist 和 seg_hosts文件 su - gpadmin echo  'source /opt/greenplum/greenplum-db/greenplum_path.sh'  /greenplum/ => mkdir /opt/greenplum/greenplum-cc-web-4.5.1 => chown gpadmin:gpadmin /opt/greenplum/greenplum-cc-web 然后,添加下环境变量 echo 'source  /opt/greenplum/greenplum-cc-web-4.5.1/greenplum-cc-web-4.5.1/gpcc_path.sh' >

    1.4K31发布于 2019-09-18
  • 来自专栏小麦苗的DB宝专栏

    Greenplum MPP 架构

    1.Greenplum MPP架构 Greenplum(以下简称GPDB)是一款开源数据仓库。 1.1.Greenplum Master Master只存储系统元数据,业务数据全部分布在Segments上。 1.3.Interconnect Interconnect是Greenplum架构中的网络层,是GPDB系统的主要组件,默认情况下,使用UDP协议,但是Greenplum会对数据包进行校验,因此可靠性等同于 Greenplum数据库将数据存储在多个segment实例中,每一个实例都是Greenplum数据库的一个PostgreSQL实例,数据依据建表语句中定义的分布策略在segment节点中分布。 详见Greenplum 数据库管理工具指南中的gpaddmirrors参考页。

    3.7K10编辑于 2023-11-27
  • 来自专栏运维前线

    Greenplum编译安装

    Greenplum部署手册 一、环境准备 操作系统 ARM-Neokylin7.6-64bit 安装包 greenplum6.9.1(源码) 设置语言 echo "export LANG=en_US.UTF #vim ~/.bash_profile 添加source /opt/gpdb/greenplum_path.sh #source ~/.bash_profile # vim all_hosts_file Binary Version: 'postgres (Greenplum Database) 6.0.0-beta.1 build dev' 20200911:15:21:33:052842 gpstart :SZD-BDL0014729:gpadmin-[INFO]:-Greenplum Catalog Version: '301908232' 20200911:15:21:33:052842 gpstart Master instance in admin mode 20200911:15:21:33:052842 gpstart:SZD-BDL0014729:gpadmin-[INFO]:-Obtaining Greenplum

    2.3K21发布于 2020-09-22
  • 来自专栏Greenplum

    Greenplum快速上手

    Greenplum快速上手 目录 快速上手Greenplum 1 目录 1 1 Greenplum的介绍 2 1.1 Greenplum产品发展历程 2 2 Greenplum市场地位 3 3 Greenplum 功能 5 3.3.3 Segment Hosts功能 5 3.4 Greenplum DB真正完全无共享的MPP数据库 6 4 Greenplum机器选型 6 4.1 机器选型一般的配置 6 5 Greenplum 软件安装 11 5.9 Greenplum 软件安装(简历互信和目录) 11 5.10 Greenplum 软件安装(校验性能) 11 5.11 Greenplum 数据库初始化 12 5.12 配置standby 3 Greenplum架构设计 3.1 Scale up架构 3.2 Greenplum架构图 3.3 Greenplum架构组成 3.3.1 Master Hosts功能 1、系统入口点 2、数据库监听器进程 Greenplum数据库,不支持网络伟岸系统(NFS) 3、Greenplum数据库不直接支持共享储存的其他功能(如重复数据消除或复制),但只要不干预Greenplum数据库的预期操作,就可以在储存供应商的纸下使用这些功能

    1.7K110发布于 2020-08-26
  • 来自专栏Greenplum

    Greenplum迁移指南

    Greenplum迁移指南 Greenplum迁移指南 目录 第一节 Greenplum数据迁移方法论 1.1 为什么要进行数据迁移 1.2 迁移整体的流程 第二节Greenplum数据迁移工具 2、性能:Greenplum相对传统关系型数据库有明显的性能提升,多个用户从Oracle迁移到Greenplum后,性能有几十倍的提升。 ,迁移至Greenplum性能在同一量级,但因为数据节点交互延迟会略有增加 并发数据加载场景 1秒以内 可以迁移至Greenplum,需要将逐笔插入操作改为微批量插入,由于Greenplum MPP架构的优势 ,会导致性能有较大的损失,甚至无法满足业务的需求,请关注Greenplum的研发进展和新版本性能,Greenplum社区正在不断增强高并发事务性特性。 第五节 PostgreSQL到Greenplum的数据迁移 5.1 一种平滑的解决方案 Greenplum与PostgreSQL无论在语法还是使用方式上,都基本上相似,所以从PostgreSQL迁移到Greenplum

    2.4K30发布于 2021-03-11
  • 来自专栏summerking的专栏

    docker安装Greenplum

    Greenplum是业界最快最高性价比的关系型分布式数据库,它在开源的PostgreSQL的基础上采用MPP架构(Massive Parallel Processing,海量并行处理),具有强大的大规模数据分析任务处理能力 | ---------------------------------------------------------------------- This is a demo of the Greenplum Binary Version: 'postgres (Greenplum Database) 4.3.99.00 build dev' 20201127:07:28:50:000017 gpstart :487243160c73:gpadmin-[INFO]:-Greenplum Catalog Version: '301605129' 20201127:07:28:50:000017 gpstart Binary Version: 'postgres (Greenplum Database) 4.3.99.00 build dev' 20201127:07:38:52:000187 gpstart

    2.7K20编辑于 2022-10-27
  • 来自专栏sdf

    greenplum资源队列

    greenplum资源队列 1、创建资源队列语法 Command:     CREATE RESOURCE QUEUE Description: create a new resource queue 代价由Greenplum数据库查询优化器(正如查询EXPLAIN 输出显示的)确定的查询的 估计共代价 进行衡量的。 因此,管理员必须要熟悉在系统中执行的典型查询,以对队列设置一个合理的阀值。 成本由Greenplum数据库查询优化器(正如查询 EXPLAIN 输出所示)确定的查询的估计总成本所衡量。 因此,管理员必须熟悉通常在系统上执行的查询,以便为被认为是小型查询设置适当的成本。

    76700发布于 2019-12-04
  • 来自专栏光城(guangcity)

    Greenplum SysCache and RelCache

    When accessing database tables, some information needs to be obtained from system tables. In order to improve retrieval efficiency, PostgreSQL provides caches, including SysCache and RelCache.

    75520编辑于 2022-12-02
  • 来自专栏技术最杂谈

    Greenplum性能分析

    http://tapd.oa.com/Greenplum/markdown_wikis/view/#1010134541008425443 2,磁盘性能测试。 refill_buffers --norandommap --randrepeat=0 --group_reporting --name=fio-write --size=10G --filename=/data/greenplum

    1.7K62发布于 2020-10-22
  • 来自专栏Greenplum

    greenplum gpcrondump命令使用

    gpcrondump工具在Master和每个Segment上转储一个Greenplum数据库的内容为SQL脚本文件。 这些脚本文件接下来可以被用来恢复这个数据库。 要转储的Greenplum数据库的名称。 -y reportfile 指定备份作业日志文件将放置在主控主机上的完整路径名。如果未指定,则默认为主数据目录或正在运行 远程,当前的工作目录。 dump Yy|Nn (default=N): > y 20190517:18:15:15:029923 gpcrondump:gpmdw:gpadmin-[INFO]:-Directory /greenplum /soft/greenplum-db/. /soft/greenplum-db/.

    2.1K30发布于 2019-08-05
  • 来自专栏Greenplum

    Greenplum Pgbench命令详解

    Greenplum PGBENCH命令详解 Greenplum PGBENCH命令详解 1 PGBENCH概念详解 1 PGBENCH 参数详解 1 查看参数详细信息 1 PGBENCH 测试案例 2

    79830发布于 2019-08-05
  • 来自专栏杨建荣的学习笔记

    Greenplum集群部署小结

    Greenplum属于一种看起来“较重”的数据库MPP架构,不像基于MySQL基于中间件的架构那么轻量,但是要说一些具体的场景,比如Greenplum支持存储过程,支持列式存储,加上分区表和内置的数据分片等多种模式 Greenplum是我知道的数据库中的角色最完整的。Master,Standby,Primary,Mirror,各种数据库中的不同角色在这里有一套完整的体系命名。 1)Greenplum的版本选择,目前有两个主要的版本类别,一个是开源版(Open Source distribution)和Pivotal官方版,它们的其中一个差异就是官方版需要注册,签署协议,在此基础上还有 通过gpssh-exkeys来打通ssh信任关系,这里需要吐槽这个ssh互信,端口还得是22,否则处理起来很麻烦 gpssh-exkeys -f hostlist 7)较为复杂的一步是打包master的Greenplum-db /conf/hostlist /tmp/greenplum-db-6.16.2.tar.gz =:/tmp 8)Master节点需要单独配置相关的目录,而Segment节点的目录可以提前规划好,比如我们把

    1.7K20发布于 2021-07-15
  • Greenplum6.8.1安装

    前言: 单位有套年代久远的Greenplum集群,接手后一直没怎么处理(也不知道怎么处理)。 最近业务系统频繁出现访问卡顿,于是便想着搭建一套环境用于测试Greenplum简介Greenplum是一款基于分布式架构的开源数据库;采用无共享(no shareing)的MPP架构(每个数据节点拥有独立的 Greenplum架构Greenplum由Master节点<协调节点>和Segment节点<数据节点>以及高速网络层三部分组成Master Host: 又称协调节点,是整个Greenplum数据库系统的入口 /greenplum-db-<version>-<platform>.rpmsudo chown -R gpadmin:gpadmin /usr/local/greenplum\*sudo chgrp -R gpadmin /usr/local/greenplum\*ssh免密gpadmin用户登陆mastter主机source /usr/local/greenplum-db-<version>/greenplum

    42710编辑于 2025-02-24
  • 来自专栏Greenplum

    greenplum时区避坑

    修改以下参数把美国中部时区修改成中国标准时区(CST) 1、中国标准时区(CST)和美国中部时区(CST)重名 2、GP默认会将CST识别为美国中部时区 3、导致国内时区为CST的服务器在事件计算时出现意外结果 4、解决方法      4.1 修改GP安装目录下/share/postgresql/timezonesets/Default      4.2  找到CST - 21600这行,修改为CST 28800      4.3 所有Segment和Master服务器全部修改     4

    1.1K80发布于 2020-05-28
领券