ann-toque’s diary

@YASU11552288 の思うことをつらつらと

MariaDB ColumnStore 検証

f:id:ann-toque:20180310203614p:plain

モチベーション

あ…ありのまま 昨年 起こった事を話すぜ!
おれはデータマートを作るPJTをやっていたと思ったら
いつのまにかデータウェアハウスを作っていた 何を言ってるか(ry

というわけでMariaDB の ColumnStore の環境を構築し、
以下のgithubに上がっている「InnoDBと比べたらColumnStore神やで」リポジトリを試して見た。

mariadb-columnstore-samples/flights at master · mariadb-corporation/mariadb-columnstore-samples · GitHub

環境

  • OS: centos7
  • CPU: 4core
  • Memory: 8GB
  • SSD: 240GB

MariaDB ColumnStore 設定関連

下記のスライドの設定に基づいた。22スライド目ぐらいからインストール手順

www.slideshare.netクラスター構成試したかったけど、今回はシングルノードで

結果

このスペックでの mariadb-columnstore-samples/flights/queries/ の クエリの実行結果は以下の通り

query time
2016_airline_summary.sql 1.97 sec
airline_delay_types_by_year.sql 2.64 sec
ca_2016_delays.sql 1.33 sec
bayarea_2016_delays.sql 0.67 sec
bayarea_nov_2016_delays.sql 0.50 sec

なるほど…InnoDBとの比較もして見ないと色々知らない自分には、早いのかすらわからないw

mariadb-columnstore-samples flights でググルと InnoDBやSparkとかと比べてるので、興味ある人はググってください ( ^ω^ )