HP Discover Performance Podcastシリーズの次期版では、顧客分析を中心とした大規模なデータの変化を深く理解することができます。
異なる問題
HP Verticaのゼネラルマネージャーは、次世代のAnywhere Analyticsプラットフォームの見通しを設定し、MZI HealthCareはHP Verticaを使用して大きなデータ患者の生産性の宝石を識別する方法を提供しています; HP Verticaアーキテクチャは、Infinity保険に関するBIの問合せを厳しくする大規模なパフォーマンスブーストを提供します。 Podcastの要約:Podcast要約:HPエキスパートは、HP DiscoverのHAVEnの大規模なデータニュース、将来のセキュリティとリスクについてのHPのグローバルCISO Brett Wahlin、HP Verticaによる幅広い情報共有により、Guess ‘小売戦略、プラットフォーム3.0が敏捷なアクセスを期待し、企業全体で実行可能なインテリジェンスの分配を期待している:Open Groupパネル、高度なIT監視によりユナイテッド航空に焦点を当てた予測診断、Converged Cloud HP Discoverのニュース
このケーススタディパネルディスカッションでは、さまざまな組織が顧客に関するより優れた分析手法を開発する手段を提案しています。高性能で費用対効果に優れた大規模なデータ処理が、顧客の望みや好みに応じて、急速に学習曲線を変える方法を学びましょう。
エキスパートパネルは、アムステルダムに本拠を置くSpil GamesのReporting and AnalyticsディレクターのRob Winters、ミラノを拠点とするJobrapidoのビジネスインテリジェンスディレクターDavide Conforti、サンフランシスコのYammerのAnalyticsディレクター、Pete Fishmanから構成されています。
ビッグデータ分析、Big Data Analytics、DataRobotはデータサイエンスの欠点を自動化することを目指している、Big Data Analytics、MapR創設者のJohn Schroederが辞任し、交換するCOO
最近のボストンのHP Vertica Big Data Conferenceで行われたこのディスカッションは、Interarbor SolutionsのアナリストであるDana Gardnerによって司会を受けました。
以下は抜粋です。
企業は長い間顧客を分析してきました。今何が違うの?
Fishman:われわれはクラウドソフトウェアサービスであり、そのデータは大きい。顧客に関する私たちのデータは、今やすべて中央の場所に住んでいます。あなたのソフトウェアを使用している企業間で集計することで、リフトの測定という意味で経済的な意味からも、実際に重要なサンプルサイズと実際の推論を得ることができますが、実際にはサンプルサイズが大きすぎるため、 。
アナリティクスを貴重なものにし、お客様のことを学ぶための出発点です。
ウィンターズ:私の場合、問題の空間は、私が数年前のものとは大きく異なっています。
私はこれの前にテレコムにいた。そこには2,500万人の人がいますが、1ヶ月に1度それらを再考すれば十分速いです。 Webスケールの問題では、私は2億人の顧客を扱っており、10分または15分以内にそれらを再販しなければなりません。したがって、あなたはかなり多くのデータをキャプチャしています。私たちは、毎日何十億ものレコードをシステムに導入しています。できるだけ早く使用する必要があります。これは、オンラインでのカスタマーエクスペリエンスでは分が重要になるためです。
Conforti:それは私たちと全く同じ話です。現在、月に4,000万人のユニークビジターがいます。 2006年のスタートアップ以来、私たちは2桁台で成長してきました。ユーザーインタラクション、ユーザーのオンサイト行動、オンサイトでのより多くの取り組み、 hocユーザーエクスペリエンス
ウィンターズ:私たちは主にプラットフォームです。私たちはいくつかのゲーム開発と出版を行っていますが、私たちのコアビジネスは、人々が来て、興味のあるコンテンツを見つけることができるプラットフォームにすぎないということです。私たちは約9年間続いてきました。
私たちはオランダの[ゲーム]会社として出発し、さまざまな言語で他のローカルドメイン名を取得しました。現時点では、およそ20の異なる言語で実行される約50の異なるプラットフォームがあります。私たちは世界中のお客様をサポートしています。ある月には、200カ国以上にわたり、サイトにアクセスしています。
ビジネス全体が変化しており、お客様が提供できるカスタマーエクスペリエンスに基づいて競争しています。私たちには、少女、若い女の子、8-14人、男の子、そして女性たちの2つのターゲットオーディエンスがあります。
Fishman:Yammerはサンフランシスコのスタートアップです。私たちは約1年前にMicrosoftによって買収され、我々はより大きなOffice組織の一部です。私たちは、この多対多のコミュニケーションモデルを採用し、貴社のコミュニケーションをより効率的にすることで、企業社会としての自信を持っています。
それは、関連する知識や専門家を浮上させ、仕事の生活をより良くすることです。そこにアナリティクスチームを運営しています。私たちは基本的に、集計された顧客の行動と、ツールの人々のどの部分を使用しているのかを見ていきます。
これは、創業者David SacksとAdam Pisoniが、Facebookが今日と同じくらい関連性がないときに戻った、本当に革命的なアイデアでした。しかし、私たちは人々が社会生活の中で交流し、そのコミュニケーションの効率をもたらす方法を学んだ多くの方法を活用してきました。彼らは、これらのソーシャルネットワークがあなたのビジネスのプライベートで安全なコンテキストで成長し、関連性があることを知りました。
Conforti:Jobrapidoはイタリア人のビートロメルがミラノでスタートした起業家的な挑戦として2006年にスタートしました。イタリアのオンライン市場では、米国やヨーロッパの他の国と比べて人材プールの幅が広いわけではないので、それは非常に困難です。私たちがしているのは、求職者に彼らの新しい仕事を見つける機会を提供することです。
私たちはオンラインの求人検索エンジンであり、現在20カ国語以上の58カ国で営業しています。私たちは皆、ミラノのこの大きな本部にいろいろな国籍を持っています。もちろん、私たちは多くのお客様に、現地語でサービスを提供しています。
ソーシャルネットワーク
最近、私たちはロンドンに本拠を置くビッグ・メディア・グループであるデイリー・メール・グループによって購入されました。私たちのためには、求職者の獲得と保持とエンゲージメントから、常に品質とユーザーエクスペリエンスをオンサイトで扱うことがすべてです。私たちは、顧客の好みに基づいてより良い顧客を獲得し、維持する方法を理解するために、大きなデータウェアハウスを使用しています。また、Googleのアルゴリズムとほぼ同じように動作するマッチングアルゴリズムを調整するためにも使用します。
私たちは、さまざまな情報源、求人掲示板やその他の求人サイトから、または個々の企業の作業ページに直接多くのコンテンツをクロールします。大きなデータベースにまとめ、統計ツールを使用して、求職者がどのような順位付けをしているかを推測します。
だから、私たちが何百万人も何百万人もの異なるスポンサー付きまたは有機的な投稿で毎日やっている、非常に重いデータの練習です。
たとえば、Yammerの人たちや、Spil Gamesの人がソフトウェアエンジニアを雇いたいのであれば、ジョブボードにスポンサーしなくてもJobrapidoでスポンサー広告を直接宣伝することができます。だから私たちは仕事の連鎖を集約して単純化しようとしています。
分析のためにこの大きなデータを得ることについて、あなたが解決しなければならなかった問題は何でしたか?
ウィンターズ:私にとって、チャレンジは複数回だった。どのようにこのデータの問題に対処していますか?以前にデータを見たことがない従業員にとって、それを有意義な方法でどのように提示するのですか。また、モデルをモデルに対して実行し、できるだけ早く実稼働環境に戻すことで、以前のプラットフォームよりも優れたエクスペリエンスを顧客に提供できますか?
私の問題は、誰も以前に私の会社でそれをやろうとしたことがなかったということでした。私たちは事実上きれいなスレートで歩きました。しかし、さまざまなデータソースを持ってくると、すぐに必要となることを知っているすべてのものから始めます。
他のデータソースに必要なリンクが表示され始めます。現時点では、何千ものデータベースからデータを取り込み、数多くのアプリケーションプログラミングインターフェイス(API)に統合しています。あなたは登録情報を与えていない人々のためにパーソナライズできるように、あなたのWebログデータを引き出しています。
最初にデータウェアハウスのアプライアンスやアプリケーションを探し始めると、インデックスなしでPostgresを実行していました。生産データのコピーだけでした。データの場合、クエリの実行には8時間かかります。これは数百万行のテーブルです。
我々は、典型的な行ベースの解決策が出ていることを知っていました。そこで、他のアプリケーションのいくつかを調べ始めました。大きなものはTeradata、Exadata、Greenplumですが、これらのアプリケーションのライセンスを購入できるようにするには、社内のすべての従業員の住宅に抵当権を持たなければなりません。だから彼らは出ていた。
大規模なデータ
それは速度についてです
パフォーマンスの向上
エンドツーエンドのコスト
その後、Infobrightのような他のブティックベンダーを見ていきました。基本的に、HP Verticaではデータベース管理者(DBA)の負担が比較的小さいため、メンテナンスを頻繁にすることなく迅速に開発できます。
価格設定モデルは、達成する必要があるものに合っており、パフォーマンスは非常に優れているため、最適化に今や時間を費やす必要はありません。インデックスの最適化やクエリの最適化、パスの書き換えをしなくても、基本的にデータ駆動型の組織になるという非常に迅速な動きが可能です。
システムにたくさんのものを投げ込んで、一緒に打ち砕き、結果を得て、すぐに大きな勝利を得ることができます。
私たちにはデータセンターがあり、私たちは私たちのプライベートサーバーですべてを行います。私たちのために、次のステップはおそらくもっとプライベートクラウドモデルに移行していくことでしょう。うまくいけば、Verticaも同様の環境で動作します。
Yammerでは、あなたの大きなデータの問題は何でしたか?どのように解決しましたか?
フィッシュマン:私たちの問題は、企業の社会空間に取り入ろうとする人々がたくさんいたことでした。多くのソーシャルネットワークがポップアップしており、本質的に仕事で注目を集めることは課題です。
競争優位を得るためにはデータが必要であると感じました。 David SacksとAdam Pisoniは、迅速な反復で消費者向けソフトウェア会社を開発するビジョンを持っていました。その急速な反復により、製品のどの部分が動作しているかに基づいて自分自身を再調整することができれば、さらに有利になります。私たちのデータの問題は、開発方法論において、データを競争上の優位性にすることに関する主なものでした。
あなたがそれを採用した時点までの道具だったVerticaについてはどうでしたか?それは並行性の問題、ボリュームの問題、速度、または上記のすべてですか?
Fishman:それはすべてですが、実際のハイライトはいつもスピードになります。特にBay Areaだけでなく、特にデータ分野での才能のための驚異的な競争を考えると、
タイトルにデータがある人は、非常に求められている人です。彼らが取り組んでいるプロジェクトについて興奮しているような挑戦者であり、自分の能力を最大限に引き出すことができる驚異的な解決策である人々のためのサイクルタイムを最小限にする能力は本当に重要です。私たちの空間でも、ソフトウェア開発でも同じです。
このような大きなリスクと課題を抱える私たちが正しい方向に進んでいるかどうかを素早く特定し、どこに向かう方向に向かうかは、Yammerが成功するためには非常に重要です。
Davide、データ問題をどうやって扱いましたか?
Conforti:私がJobrapidoに入社したとき、私たちはすでにA / Bテストを実施しました。これは製品革新の幕開けです。あるボタンの色やフォントを変更することから、別のレイアウトに変更することから、ユーザーの関与を向上させることに多大な影響を与えるため、すべてをテストしたいと考えています。
これまではGoogleアナリティクスツールを使用していましたが、サンプルデータであるためあまり好きではなかったので、統計的に有意義な結果にはほとんど達しませんでした。私たちは、柔軟性、パフォーマンス、さらに高いレベルの制御とデータの一貫性を保証するデータウェアハウスを構築することに決めました。これは、ソースからビジュアライゼーションへのエンドツーエンドの制御であり、製品開発の面でより実用的なものにするためです。
Verticaでは、これを正確に実行しました。さまざまなデータソースをすべて1つのバケットに入れて整理したところ、データモデルを完全に制御できました。私のチームでは、これらのデータモデルを管理しています。私たちのビジネスモデルは、生きている動物、生き物の生き物なので、パズルにピースを追加したり、もはや興味深いものを取り除いたりすることがどれほど速くて魅力的ですか?
我々は、この柔軟性とVerticaが許す高いレベルのコントロールに本当に感謝しています。これにより、革新的なスループットが大幅に改善され、今後さらに改善される予定です。
現在、毎日約30 GBのデータをVerticaで処理しています(つまり、Verticaで30 GB /日をアップロードしています)。しかし、我々は数ヶ月後にそれを2倍にする予定だ。サイト上の求職者のクリックパターンについてもっと知りたいのですが、これはVerticaに流れる大量のデータです。また、テラバイト単位のライセンスは将来的に倍増する可能性があります。
私が皆さんと共有できるもう一つの難しい事実は、Verticaを使っている皆さんのすべてがクエリの最初の実装に満足する必要はないということです。それを最適化できる場合は、ほとんどの場合、クエリのパフォーマンスが100%以上向上します。これは私の個人的なコンサルタントやアドバイザーの経験です。 Verticaはサポートを提供してくれることを嬉しく思います。これは本当に価値あるものです。
ウィンターズ:成功の指標としては、概念実証(POC)を行っていたときに主にクエリのパフォーマンスを調べました。その時点では、予測やパーソナライズに使用するのではなく、分析とレポートのためだけに使用していました。
私たちが目にしたことは、索引付けされたPostgresデータベースに対するものでした。私たちはデータを最適化しました。私たちのクエリは1,000%以上速く実行されていましたが、Verticaは非常に線形にスケーリングしていましたが、Postgresではテーブルにデータを追加すると窒息して死にました。
私にとっては、実際に自分の仕事をして、私のチームに仕事をさせてもらうことができました。それは成功の大きなメトリックです。
もう1つは、比較的小規模なクラスタでは、データベースに直接アクセスしている数百人の人々やレポート、データベースから直接情報を照会するアナリストや人々、最小限のパフォーマンスの問題で同時に行われるすべての個人化活動をサポートできるということです。それは成功の大きなメトリックです。
Fishman:Postgresデータベースとの比較であるRobと同様のフィードバックがあります。速度は、少なくとも1つ – おそらく2つ以上に近い – おそらく大きさのオーダーです。確かにコスト面では、データ全体でコスト全体を考慮する必要があります。これはテーマのようなものです。
ステッカー価格ではない有用な洞察を管理し、驚かせるためには、さまざまなコストがかかります。データソリューションを検討する際には、エンドツーエンドのコストを考慮する必要があります。テラバイトあたりのコストや何らかのコストに比べて、実際の洞察力はどれくらいですか。
私たちは確かにVerticaが最善の解決策であると感じています。私たちは3年以上にわたり顧客であり続けてきました。だからそれはかなり長い関係です。私は多日間のクエリに戻ることは想像もできませんでした。
Davideが言いましたことの1つは、Verticaにどのくらいのデータを書き込むかを予測していることです。私は貿易によって自分自身を予報者にしています。 2010年には、2011年末までのデータ量の見積もりを行っていました。これは非常に単純な補外であり、私はそれを少なくとも1桁以上間違えた。
私たちが見つけたのは、データから実際の洞察を得るようになったときに、もう少し詳しく知りたいと思うかもしれません。また、私たちの製品が成長するにつれて、データの本質的な指数関数的な成長に直面し、洞察力当たりのコストや洞察力のコストを最小限に抑えるための賢明なソリューションを採用しました。
同時に多くのことが起こっています。だから、本当に貴重な洞察力を乗り越えることは、あなたがそれについてより純粋でない時よりもずっと簡単に起こり得る。本質的に、あなたはそれの逆風に直面しています。洞察力を見つけることはより困難になります。同時に、データ量が増え、スケールメリットもあります。だから同時に多くのことが相互作用していますが、明らかにその測定基準を下げる1つの点は、ベスト・イン・ブリードのツールです。
もちろん、それを使うことができる人の情報を得ることは、単にコストを削減するよりもベストです。
フィッシュマン:もちろん。アナリティクスをコストセンターとして見ると、それは間違った見方です。収入源の最適化を目指すべきである。我々は製品をマイクロ最適化し、営業とマーケティング、ビジネスをマイクロ最適化する。アナリティクスは、自分の仕事のすべての人を改善し、人々がより効果的になるようにデータを利用できるようにします。
ポッドキャストを聞く。 iTunesで検索してください。フルテキストを読むか、コピーをダウンロードしてください。
開示:HPはBriefingsDirectポッドキャストのスポンサーです。
物語
HP Verticaゼネラルマネージャー、次世代のAnywhere Analyticsプラットフォームの見通しを立てる
HP Verticaを使用して、MZI HealthCareが大きなデータ患者の生産性宝石を特定する方法
インフィニティ・インシュアランスのBIに関する深いお問い合わせ
リアルタイムがもはや十分ではなくなると、予測的なビジネスが現れます
ポッドキャスト要約:HPエキスパートがHP DiscoverのHAVEnの大きなデータニュースを分析して説明します
HPのグローバルCISO Brett Wahlin、セキュリティとリスクの未来
HP Verticaがより深いインテリジェンスを共有し、Guessの小売戦略の分析宝石を収穫
Platform 3.0が熟しているので、機敏なアクセス、企業全体の実行可能なインテリジェンスの配布が期待されます。Open Groupパネル
先進的なIT監視機能により、ユナイテッド航空に予測診断を提供
HP Discoverのコンバージドクラウドニュース:意味
LinkedInが新しいブログプラットフォームを発表
これはBig OLAPの時代ですか?
DataRobotは、データサイエンスの果実を自動化することを目指しています
MapRの創設者John Schroederが辞任し、COOが辞任