首页 理论教育HBaseShell:在医药领域的大数据挖掘技术应用

HBaseShell:在医药领域的大数据挖掘技术应用

【摘要】:在HBase Shell提示符下执行help命令可列出所有命令列表。命名空间类命令命名空间是对表的逻辑分组,HBase可以针对命名空间分配资源限额,指定HRegionServer子集,进行安全管理等。大多数配置更改后必须重新启动HBase集群才能生效,与HRegion压缩、拆分相关的参数可以动态更改,更改后在HBase Shell中执行update_all_config命令即可生效。

1.交互模式

在HBase安装目录的bin子目录下执行hbase shell命令即可进入HBase Shell交互模式进行数据库操作。

在HBase Shell提示符下执行help命令可列出所有命令列表。

执行help'〈command〉'可显示针对某条命令的帮助信息,注意〈command〉前后要加单引号或双引号

(1)DDL命令

create:创建一张新表。

list:列出名称匹配的表。

exists:查看某张表是否存在。

describe:显示某张表的定义,也可以使用简写命令desc。

disable:停用某张表。表被停用后则无法再对其进行增删改和查询等操作,在对表执行alter命令或drop命令之前,必须先执行disable命令停用。

enable:启用某张被disable命令停用的表。表被启用后即可恢复正常操作。

alter:可在某张表中增加、修改、删除列族或者更改表的属性定义。

drop:删除某张表。在删除前必须先执行disable命令停用该表。

(2)DML命令

put:向某张表里的指定单元插入数据。通过行键和列名来指定一个单元。

scan:查询某张表中满足条件的数据。可以在行、列、时间戳等多个维度上设定查询条件。

get:获取表中给定行符合条件的数据。

count:查询某张表中的行数,默认时每1000行计一次数。

delete:删除某张表中指定单元的数据,通过表名、行键和列名指定一个单元,还可以加上时间戳。

(3)命名空间类命令(www.chuimin.cn)

命名空间是对表的逻辑分组,HBase可以针对命名空间分配资源限额,指定HRegionServer子集,进行安全管理等。HBase有两个默认的命名空间,即

hbase:系统命名空间,用于保存HBase的内部表。

Default:HBase的默认命名空间。如果一张表没有指定命名空间时,则自动属于default命名空间。

create_namespace:创建一个命名空间。

alter_namespace:修改某个命名空间的定义。

describe_namespace:显示命名空间的定义。

list_namespace:不加选项时列出所有的命名空间,也可以加上带有通配符的正则表达式选项。

list_namespace_tables:列出某个命名空间中的所有表。

drop_namespace:删除某个命名空间。

(4)其他命令

配置类命令:对HBase集群参数配置值进行动态更新。

大多数配置更改后必须重新启动HBase集群才能生效,与HRegion压缩、拆分相关的参数可以动态更改,更改后在HBase Shell中执行update_all_config命令即可生效。

通过help命令可以查看每个命令的作用和使用方法。

2.非交互模式

HBase Shell还可以以非交互方式运行,加上-n或者--noninteractive选项即可进入非交互模式,所执行命令可以通过输入重定向获取,例如:

[root@client bin]#echo"list_namespace_tables'default'"|./hbase shell-n

HBase命令也可以直接以脚本文件作为其命令行参数来执行,例如:

[root@client bin]#./hbase shell sample_cmd.txt