HBase創建數據

本章將介紹如何在HBase表中創建的數據。要在HBase表中創建的數據,可以下面的命令和方法:

  • put 命令,
  • add() - Put類的方法
  • put() - HTable 類的方法.

作爲一個例子,我們將在HBase中創建下表。

HBase

使用put命令,可以插入行到一個表。它的語法如下:

put ’<table name>’,’row1’,’colfamily:colname\’,’<value>’

插入第一行

將第一行的值插入到emp表如下所示。

hbase(main):005:0> put 'emp','1','personal data:name','raju' 0 row(s) in 0.6600 seconds
hbase(main):006:0> put 'emp','1','personal data:city','hyderabad' 0 row(s) in 0.0410 seconds
hbase(main):007:0> put 'emp','1','professional
data:designation','manager' 0 row(s) in 0.0240 seconds
hbase(main):007:0> put 'emp','1','professional data:salary','50000' 0 row(s) in 0.0240 seconds

以相同的方式使用put命令插入剩餘的行。如果插入完成整個表格,會得到下面的輸出。

hbase(main):022:0> scan 'emp' ROW COLUMN+CELL 1 column=personal data:city, timestamp=1417524216501, value=hyderabad 1 column=personal data:name, timestamp=1417524185058, value=ramu 1 column=professional data:designation, timestamp=1417524232601, value=manager 1 column=professional data:salary, timestamp=1417524244109, value=50000 2 column=personal data:city, timestamp=1417524574905, value=chennai 2 column=personal data:name, timestamp=1417524556125, value=ravi 2 column=professional data:designation, timestamp=1417524592204, value=sr:engg 2 column=professional data:salary, timestamp=1417524604221, value=30000 3 column=personal data:city, timestamp=1417524681780, value=delhi 3 column=personal data:name, timestamp=1417524672067, value=rajesh 3 column=professional data:designation, timestamp=1417524693187, value=jr:engg 3 column=professional data:salary, timestamp=1417524702514, value=25000

使用Java API插入數據

可以使用Put 類的add()方法將數據插入到HBase。可以使用HTable類的put()方法保存數據。這些類屬於org.apache.hadoop.hbase.client包。下面給出的步驟是在一個HBase表創建數據。

第1步:實例化配置類

Configuration類增加了 HBase 配置文件到它的對象。使用HbaseConfiguration類的create()方法,如下圖所示的配置對象。

Configuration conf = HbaseConfiguration.create();

第2步:實例化HTable類

有一類名爲HTable,在HBase中實現了Table。這個類用於單個HBase表進行通信。在這個類實例接受配置對象和表名作爲參數。可以實例HTable類,如下圖所示。

HTable hTable = new HTable(conf, tableName);

第3步:實例化Put類

爲了將數據插入到HBase表中,需要使用add()方法和變體。這種方法屬於Put類,因此實例化Put類。這個類必須要以字符串格式的列名插入數據。可以實例Put類,如下圖所示。

Put p = new Put(Bytes.toBytes("row1"));

第4步:插入數據

Put類的add()方法用於插入數據。它需要代表列族,分別爲:列限定符(列名稱)3字節陣列,以及要插入的值。使用add()方法將數據插入HBase表如下圖所示。

p.add(Bytes.toBytes("coloumn family "), Bytes.toBytes("column
name"),Bytes.toBytes("value"));

第5步:保存數據到表中

插入所需的行後,HTable類put實例的put()方法添加,如下所示保存更改。

hTable.put(p);

第6步:關閉HTable實例

創建在HBase的表數據之後,使用close()方法,如下所示關閉HTable實例。

hTable.close();

下面給出的是在HBase的表創建數據的完整程序。

import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.client.HTable; import org.apache.hadoop.hbase.client.Put; import org.apache.hadoop.hbase.util.Bytes; public class InsertData{ public static void main(String[] args) throws IOException { // Instantiating Configuration class Configuration config = HBaseConfiguration.create(); // Instantiating HTable class HTable hTable = new HTable(config, "emp"); // Instantiating Put class // accepts a row name. Put p = new Put(Bytes.toBytes("row1")); // adding values using add() method // accepts column family name, qualifier/row name ,value p.add(Bytes.toBytes("personal"), Bytes.toBytes("name"),Bytes.toBytes("raju")); p.add(Bytes.toBytes("personal"), Bytes.toBytes("city"),Bytes.toBytes("hyderabad")); p.add(Bytes.toBytes("professional"),Bytes.toBytes("designation"), Bytes.toBytes("manager")); p.add(Bytes.toBytes("professional"),Bytes.toBytes("salary"), Bytes.toBytes("50000")); // Saving the put Instance to the HTable. hTable.put(p); System.out.println("data inserted"); // closing HTable hTable.close(); } }

編譯和執行上述程序如下所示。

$javac InsertData.java
$java InsertData

下面列出的是輸出結果:

data inserted