HBase表描述和修改

描述

該命令返回表的說明。它的語法如下:

hbase> describe 'table name'

下面給出的是對emp表的 describe 命令的輸出。

hbase(main):006:0> describe 'emp' DESCRIPTION
ENABLED 'emp', {NAME => 'READONLY', DATA_BLOCK_ENCODING => 'NONE', BLOOMFILTER => 'ROW', REPLICATION_SCOPE => '0', COMPRESSION => 'NONE', VERSIONS => '1', TTL true => 'FOREVER', MIN_VERSIONS => '0', KEEP_DELETED_CELLS => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'false', BLOCKCACHE => 'true'}, {NAME => 'personal

data', DATA_BLOCK_ENCODING => 'NONE', BLOOMFILTER => 'ROW', REPLICATION_SCOPE => '0', VERSIONS => '5', COMPRESSION => 'NONE', MIN_VERSIONS => '0', TTL => 'FOREVER', KEEP_DELETED_CELLS => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'false', BLOCKCACHE => 'true'}, {NAME => 'professional
data', DATA_BLO

CK_ENCODING => 'NONE', BLOOMFILTER => 'ROW', REPLICATION_SCOPE => '0', VERSIONS => '1', COMPRESSION => 'NONE', MIN_VERSIONS => '0', TTL => 'FOREVER', K

EEP_DELETED_CELLS => 'false', BLOCKSIZE => '65536', IN_MEMORY => 'false', BLOCKCACHE => 'true'}, {NAME => 'table_att_unset', DATA_BLOCK_ENCODING => 'NO

NE', BLOOMFILTER => 'ROW', REPLICATION_SCOPE => '0', COMPRESSION => 'NONE', VERSIONS => '1', TTL => 'FOREVER', MIN_VERSIONS => '0', KEEP_DELETED_CELLS => 'false', BLOCKSIZE => '6

修改

alter用於更改現有表的命令。使用此命令可以更改列族的單元,設定最大數量和刪除表範圍運算符,並從表中刪除列家族。

更改列族單元格的最大數目

下面給出的語法來改變列家族單元的最大數目。

hbase> alter 't1', NAME => 'f1', VERSIONS => 5

在下面的例子中,單元的最大數目設置爲5。

hbase(main):003:0> alter 'emp', NAME => 'personal data', VERSIONS => 5 Updating all regions with the new schema... 0/1 regions updated. 1/1 regions updated. Done. 0 row(s) in 2.3050 seconds

表範圍運算符

使用alter,可以設置和刪除表範圍,運算符,如MAX_FILESIZE,READONLY,MEMSTORE_FLUSHSIZE,DEFERRED_LOG_FLUSH等。

設置只讀

下面給出的是語法,是用以設置表爲只讀。

hbase>alter 't1', READONLY(option)

在下面的例子中,我們已經設置表emp爲只讀。

hbase(main):006:0> alter 'emp', READONLY Updating all regions with the new schema... 0/1 regions updated. 1/1 regions updated. Done. 0 row(s) in 2.2140 seconds

刪除表範圍運算符

也可以刪除表範圍運算。下面給出的是語法,從emp表中刪除「MAX_FILESIZE」。

hbase> alter 't1', METHOD => 'table_att_unset', NAME => 'MAX_FILESIZE'

刪除列族

使用alter,也可以刪除列族。下面給出的是使用alter刪除列族的語法。

hbase> alter ‘ table name ’, ‘delete’ => ‘ column family ’

下面給出的是一個例子,從「emp」表中刪除列族。

假設在HBase中有一個employee表。它包含以下數據:

hbase(main):006:0> scan 'employee' ROW COLUMN+CELL

row1 column=personal:city, timestamp=1418193767, value=hyderabad

row1 column=personal:name, timestamp=1418193806767, value=raju

row1 column=professional:designation, timestamp=1418193767, value=manager

row1 column=professional:salary, timestamp=1418193806767, value=50000 1 row(s) in 0.0160 seconds

現在使用alter命令刪除指定的 professional 列族。

hbase(main):007:0> alter 'employee','delete'=>'professional' Updating all regions with the new schema... 0/1 regions updated. 1/1 regions updated. Done. 0 row(s) in 2.2380 seconds

現在驗證該表中變更後的數據。觀察列族「professional」也沒有了,因爲前面已經被刪除了。

hbase(main):003:0> scan 'employee' ROW COLUMN+CELL
row1 column=personal:city, timestamp=14181936767, value=hyderabad

row1 column=personal:name, timestamp=1418193806767, value=raju 1 row(s) in 0.0830 seconds

使用Java API添加一列族

可以使用HBAseAdmin類的addColumn方法添加一列家族的表。按照下面給出的步驟將一個列族添加到表中。

第1步

實例化HBaseAdmin類。

// Instantiating configuration object Configuration conf = HBaseConfiguration.create(); // Instantiating HBaseAdmin class HBaseAdmin admin = new HBaseAdmin(conf);

第2步

addColumn()方法需要一個表名和一個HColumnDescriptorclass對象。因此需要實例化HColumnDescriptor類。 HColumnDescriptor依次構造函數需要一個列族名稱用於添加。在這裏加入了一個名爲「contactDetails」到「employee」表的列族。

// Instantiating columnDescriptor object HColumnDescriptor columnDescriptor = new HColumnDescriptor("contactDetails");

第3步

使用addColumn方法添加列族。通過表名和HColumnDescriptor類對象作爲這個方法的參數。

// Adding column family admin.addColumn("employee", new HColumnDescriptor("columnDescriptor"));

下面給出的是一個完整的程序,用於添加一列族到現有的表。

import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.hadoop.hbase.MasterNotRunningException; import org.apache.hadoop.hbase.client.HBaseAdmin; public class AddColoumn{ public static void main(String args[]) throws MasterNotRunningException, IOException{ // Instantiating configuration class. Configuration conf = HBaseConfiguration.create(); // Instantiating HBaseAdmin class. HBaseAdmin admin = new HBaseAdmin(conf); // Instantiating columnDescriptor class HColumnDescriptor columnDescriptor = new HColumnDescriptor("contactDetails"); // Adding column family admin.addColumn("employee", columnDescriptor); System.out.println("coloumn added"); } }

編譯和執行上述程序,如下所示

$javac AddColumn.java
$java AddColumn

上述編譯只有已經設置「.bashrc」中的類路徑。如果還沒有,請按照下面編譯給出.java文件的程序。

//if "/home/home/hadoop/hbase " is your Hbase home folder then. $javac -cp /home/hadoop/hbase/lib/*: Demo.java

如果一切順利,它會生成以下的輸出:

column added

使用Java API刪除列族

可以使用HBAseAdmin類的deleteColumn()方法刪除列族。按照下面給出的步驟添加一個列族到表中。

第1步

實例化HBaseAdmin類。

// Instantiating configuration object Configuration conf = HBaseConfiguration.create(); // Instantiating HBaseAdmin class HBaseAdmin admin = new HBaseAdmin(conf);

第2步

使用deleteColumn()方法添加列族。傳遞表名和列族名作爲這個方法的參數。

// Deleting column family admin.deleteColumn("employee", "contactDetails");

下面給出的是從現有表中刪除列族的完整的程序。

import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.MasterNotRunningException; import org.apache.hadoop.hbase.client.HBaseAdmin; public class DeleteColoumn{ public static void main(String args[]) throws MasterNotRunningException, IOException{ // Instantiating configuration class. Configuration conf = HBaseConfiguration.create(); // Instantiating HBaseAdmin class. HBaseAdmin admin = new HBaseAdmin(conf); // Deleting a column family admin.deleteColumn("employee","contactDetails"); System.out.println("coloumn deleted"); } }

編譯和執行上述程序如下所示。

$javac DeleteColumn.java
$java DeleteColumn

下面列出的是輸出:

column deleted