Aerospike SQL Powered by Starburst

StarburstによるSQLアナリティクス

Aerospike SQL Powered by Starburstは、Aerospike Database 6に緊密に統合された分散型SQLアナリティクスエンジンを提供します。Starburst Enterpriseを搭載したAerospike SQLは、オープンソースのTrinoプロジェクト(旧PrestoSQL)のエンタープライズグレードの実装を提供し、エアロスパイクがインストール、管理、サポートします。Aerospike DatabaseとStarburst SQLエンジンの組み合わせは、SQLユーザーがダッシュボード、アドホッククエリ、またはPythonアプリケーションで鋭い洞察を迅速かつコスト効率高く生成することを可能にします。

ペタバイト級のデータにおける超並列SQLアナリティクスの実現

diagram: High speed SQL access to Aerospike real-time data

分析用Aerospikeリアルタイムデータへの高速SQLアクセス

Aerospike SQLを使用することにより、SQL開発者はAerospike Real-time Data Platformの次のパフォーマンスとスケーラビリティにおけるメリットを享受できます:

  • checkmark

    Aerospike Database 6で発表された超並列セカンダリインデックス
  • checkmark

    高スループットバッチ処理(読み取り、書き込み、更新、削除)
  • checkmark

    大容量メモリ・システム、フラッシュ・ストレージ(SSD、PCIe、NVMe)、ハイブリッド・アーキテクチャを活用し、サブミリ秒のデータ処理を実現するハイブリッド・メモリ・アーキテクチャ

Aerospike SQLの主要機能

エアロスパイクのデータにANSI SQLクエリを実行し、大量のデータに対してインプレースでオンデマンドのSQLアナリティクスを実施します。
Aerospikeクラスタ間でクエリを統合し、複数クラスタにまたがるシングルアクセスポイントを設定します。
エアロスパイクに保存されたデータと、TableauやPower BIなどの一般的なビジネスインテリジェンス(BI)ツールを活用してダッシュボードを作成します。
エアロスパイクの大規模な並列処理、述語プッシュダウン、セカンダリインデックスを使用して、高パフォーマンスのSQLクエリを実行します。(クエリの実行速度は約80倍)
Trino のコストベースオプティマイザ (CBO) を行数経由で活用し、クエリを最適化。Aerospikeコネクタは、Presto CBOに対応する2種類のPresto コネクタのうちの一つです。
クライアントからAerospikeクラスタまでの間のTLS、ASDBを使用したPrestoユーザーのLDAPおよびPKI認証、公平な使用を保証するサーバークォータのサポートにより、データを保護します。
エアロスパイクとStarburstが提供する業界最高峰のサポートにより、ユースケースを迅速に実運用できます。
オンプレミスでも、Amazon Web Services、Azure、Google Cloud Platformなどのクラウドでも、あらゆる環境にデプロイ することができます。

ターゲットユースケ―ス

Aerospike SQL Powered by Starburstは、データアナリスト、データエンジニア、データサイエンティスト、監査/コンプライアンスチームに向け、さまざまな鋭いSQLアナリティクスのユースケ―スを提供します。

データアナリスト

  • 膨大なデータセットに対してアドホックなSQLクエリをインプレースで実行することを可能にします。 ""新しいバナー広告をクリックしたユーザー数をカウント""等
  • SQLアナリティクスとTableau、Power BI、QlickなどのBIツールを使用して洞察に満ちたダッシュボードを作成することができます

データエンジニア

  • 探索的データ分析(EDA)
  • PythonとJupyter notebookを使用して、複雑なデータモデルをプログラムで開発/クエリすることができます

データサイエンティスト

  • 機械学習モデルを適用する前にデータの分布、異常、相関、その他の特性を理解するためのデータ探索と分析が可能です。

監査/コンプライアンス

  • SQLクエリを使用してコンプライアンス維持を実現します
  • 監査証跡機能により、誰がいつ機密データにアクセスし、どのデータにアクセスしたかを把握することができます

Aerospike + Starburst: リアルタイムデータからのSQLアナリティクスインサイト

Aerospike SQL Powered by Starburstは、SQLユーザーや開発者がAerospikeデータベースに格納されたデータにアクセスできるようにする、Aerospike Real-time Data Platformの新しい製品オプションです。

この製品は、リアルタイム・データ・プラットフォームのリーディング・プロバイダーであるAerospikeと、汎用性の高いアナリティクスを提供するStarburstとの間のOEMおよびサポート提供の契約により提供可能となっています。

diagram: Aerospike + Starburst: SQL Insights from Real-time Data

この契約により、顧客は一つの製品であることによりインストール、設定、運用、サポート源が一つに集約されるメリットを受けることができ、両プラットフォームの総合力で、汎用性に優れた高速SQLアナリティクスとリアルタイムデータ処理が可能になります。

Starburst搭載AerospikeSQLの仕組み

ここでは、このソリューションがどのように機能するかを紹介します。Aerospike Connect for Presto-TrinoはStarburstワーカーノードにインストールされます。Aerospike Databaseのインストールとライセンスは別途必要になります。

diagram: How Aerospike SQL Powered by Starburst Works

Starburst搭載AerospikeSQLの仕組み

追加リソース