ThoughtSpot + Databricksがデータサイエンスとビジネス間の分断の架け橋に

あらゆる部門のビジネスリーダーに、自分の部門または組織にとって最大の機会は何かと尋ねたら、「データをうまく活用すること」と答えるでしょう。データが第一線の意思決定者を支援するために活用されているか、ビジネスに直面する最も戦略的な決定を導くために活用されているかに関係なく、データには製品やサービスを改善し、顧客満足度を向上させ、生産性を高める能力があることは疑う余地がないことが、Harvard Business Reviewの調査で示されています。

機械学習やデータサイエンスがビジネスの新たな可能性を具体的に示すにつれ、データの有望さも増大し続けています。その一方で、ビジネスユーザーのデータ活用能力も高まっています。それでも、ほとんどの組織では、ビジネスにおける意思決定の方法を完全には変えられずにいます。データサイエンスのスキルを備えた人々とビジネスを担う人々の間のギャップは、今日までの間に広がりすぎてしまいました。

レイクハウスの登場

私たちはどのようにして今日の状態に至ったのでしょうか。組織はデータのどの部分において混乱しているのでしょうか。ここ10年間は、収集し保存するデータの急増を目の当たりにしてきました。

しかし、これは単にデータ量が増えているだけではなく、増殖しているのです。これは、データの種類を指しています。組織が長年取り扱ってきた構造化データは増大し続けている一方、非構造化データという新たな機会が存在しています。これらの異なる種類のデータにはストレージからアーキテクチャに至るすべてのもの対して異なるアプローチが必要であり、データウェアハウスとデータレイクの両方が生み出されました。

同時に、クラウドコンピューティングのメリットが爆発的に向上しました。企業は、従来のオンプレミス環境から移行し、クラウドが提供する俊敏性、規模の大きさ、柔軟性を活用し、それらをデータウェアハウスとデータレイクにもたらそうとしています。この半年間で、パンデミックにより移行は10倍加速しました。企業が未曾有の時代を切り抜けるための新たな方法を探しているからです。

それでも、本質的に異なるデータレイクとデータウェアハウスに伴う問題は、クラウドであっても存続します。データウェアハウスは分析とレポート作成に対して優れていますが、ファイルタイプの多様性に欠けており、ストリーミングデータのサポートは限られています。一方、データレイクはデータサイエンスと機械学習に対しては優れていますが、パフォーマンスが乏しく、適切なBIと分析が欠落しており、セットアップが複雑です。

この問題に対する1つのソリューションが、データレイクに信頼性、品質、パフォーマンスをもたらす新しいパラダイム:レイクハウスです。

レイクハウスは、データサイエンス、機械学習、BI、ストリーミング分析を含むあらゆるユースケースに対する単一の統一されたエクスペリエンスを、ビジネスに提供します。データレイクとデータウェアハウスの最も優れた部分をもたらすことで、さまざまなアプリケーションに対して、より完全で強力なデータ管理アーキテクチャを生み出します。特に、機械学習とAIのアプリケーションの構築を目指すデータサイエンティストに恩恵をもたらします。

検索によってあらゆるユーザーにデータサイエンスを提供

企業はデータサイエンスの可能性を認識し、それを活用するために多額の投資を行ってきましたが、多くの組織は十分な価値を実現できていません。これには2つの理由があります。まず、データプロフェッショナルがモデルの構築とトレーニングに時間と無数のリソースを費やしても、そのモデルが実働に進むことは決してありません。次に、おそらくさらに重要なこととして、これらのモデルから得られた結果は、より的確な意思決定をするためにビジネスで使用されていません。ナレッジワーカーの数は多く、それに対してデータプロフェッショナルの数が少なすぎるため、この谷間を飛び越えることができないのです。

この度、初めてレイクハウスに検索機能をもたらすDatabricksとThoughtSpotとの新たなパートナーシップを発表することを大変嬉しく思います。ThoughtSpot Cloud for Delta Lakeをはじめ、Databricksの新しいSQL Analytics Serviceを是非ご活用ください。この新しいパートナーシップにより、共通のお客様はデータレイクハウスのメリットを得られるだけでなく、統一されたデータと分析のパワーを検索機能を通じてビジネスユーザーが活用できるようにすることで、そのメリットを多くの人にもたらすことができます。

ThoughtSpotはDelta Lake内でデータを自動的に分析します。Delta Lakeは、Databricksに対してレイクハウスを有効にする構造化トランザクションレイヤーで、そのデータを元にして独自の検索エクスペリエンスを生み出します。その後、あらゆるスキルレベルのユーザーがシンプルな自然言語を使用してDelta Lakeを検索できます。自然言語はThoughtSpotによって即座にSQLクエリに変換され、数秒で答えが提供されます。ThoughtSpotがDelta Lakeに対して直接クエリするため、これらはすべて高度なガバナンスによって安全に行われます。

たとえば、サプライチェーンの担当者が、異なる休業スケジュールが在庫コストにもたらす影響を把握しようとする場合があります。データサイエンティストは、DatabricksのDelta Lake内で構造化データと非構造化データの両方を使用して、機械学習モデルを構築してトレーニングできます。その後、サプライチェーン担当者はThoughtSpotを使用して、異なるシナリオでの各種製品またはSKUへの影響を検索し、モデルと基盤となるデータからのインサイトと予測を活用し、数秒で答えを得ることができます。

必然的に、最初の答えから次の質問が発生します。ThoughtSpotを使用すれば、データプロフェッショナルに新しいダッシュボードやレポートの作成を依頼する代わりに、自ら新しい検索ワードを入力するだけで答えを得ることができます。この一瞬の対話により、データサイエンティストの成果が制限や遅延なく直接ビジネスにもたらされ、ビジネスユーザーはより多くの情報に基づいて意思決定し、さらに価値を引き出すことができます。

組織が将来的に成功したいのであれば、すべてのデータを活用する方法と、ビジネスがこのデータに基づいて対応できるようにする方法の両方を革新し続けなければなりません。私達は、データレイクハウスの堅牢なパワーに検索機能を取り入れることで、組織がその将来を今日可能にできるようにサポートします。

詳しくは、今すぐトライアルを入手し、ThoughtSpotとDatabricksをどのように活用できるかをご確認ください。