モチベーション
あ…ありのまま 昨年 起こった事を話すぜ!
おれはデータマートを作るPJTをやっていたと思ったら
いつのまにかデータウェアハウスを作っていた 何を言ってるか(ry
というわけでMariaDB の ColumnStore の環境を構築し、
以下のgithubに上がっている「InnoDBと比べたらColumnStore神やで」リポジトリを試して見た。
環境
- OS: centos7
- CPU: 4core
- Memory: 8GB
- SSD: 240GB
MariaDB ColumnStore 設定関連
下記のスライドの設定に基づいた。22スライド目ぐらいからインストール手順
www.slideshare.net ※ クラスター構成試したかったけど、今回はシングルノードで
結果
このスペックでの mariadb-columnstore-samples/flights/queries/
の
クエリの実行結果は以下の通り
query | time |
---|---|
2016_airline_summary.sql | 1.97 sec |
airline_delay_types_by_year.sql | 2.64 sec |
ca_2016_delays.sql | 1.33 sec |
bayarea_2016_delays.sql | 0.67 sec |
bayarea_nov_2016_delays.sql | 0.50 sec |
なるほど…InnoDBとの比較もして見ないと色々知らない自分には、早いのかすらわからないw
mariadb-columnstore-samples flights
でググルと
InnoDBやSparkとかと比べてるので、興味ある人はググってください ( ^ω^ )