Talend(タレンド)

製品概要

様々なクラウドサービスやソーシャルメディアがスタートする現在のシステム環境において、よりスピーディな経営判断を実現するためには、如何にしてオンプレミスとクラウド双方のデータ(しかも構造データ、非構造データが混在する)をスムーズに統合・連携できるのかが重要です。
さらに今日では、IoTや機械学習(AI)の発展によって、従来のシステムでは管理しきれないほどの膨大なログデータやセンサーデータを効率的に蓄積し、リアルタイムに活用できるデータレイクの構築が求められています。

Talendはオープンソース発祥のETL/ESBソリューションで、テキストファイル、データベースやクラウドサービスなどのデータソースを、スケジュールされたジョブ、あるいはリアルタイムに連携できるデータ連携基盤としてワールドワイドで多くの実績を持ちます。
2016年にNASDAQ上場して以降、ガートナー社のData Integration Tool分野のマジック・クアドラントにおいてリーダーの評価を受けています。

特に開発・運用者単位のサブスクリプションライセンスモデルによる導入のしやすさ、オープンソースのETLベンダーとして培ってきた技術的背景に基づく堅牢な製品づくりとHadoopネイティブ、Apache Storm/Apache Sparkへの対応、AWS、Google Cloud Platform、Microsoft AzureなどiPaaSへの対応、Data Preparationといったマーケット・トレンドが求める先進的な技術への対応力を評価されています。

導入のメリット

より効率的なビッグデータの活用

Talendは、Spark StreamingやHadoopといった先進のデータ処理技術を単なるデータの入出力先として扱うのではなく、Real-time Streaming、Map Reduceといった各ソリューションの特性を最大限に活用できるジョブとして実装します。

これらの先進技術を利用する場合も、ジョブ開発はコンポーネントの配置とプロパティ設定中心の従来のジョブと同じ手法で開発できるため、ジョブ開発者はHadoopベンダーの仕様差異やビッグデータテクノロジーの詳細について、すべて理解する必要なく、自分たちのデータ利用方法の開発に集中することができます。

ETL/ESB

Talendは、単一プラットフォーム上でバッチ処理(ETL)とアプリケーション連携(ESB)という、要件の異なるジョブを開発し、運用することが可能です。900種以上提供されているコンポーネントにはETL/ESBの共通で使用可能なものといずれかのジョブに特化したものが提供されており、これらを組み合わせることで、要件に最適なジョブを開発することができます。

データプレパレーション

データ統合・連携処理基盤はシステム開発部門を中心として構築することが一般的ですが、データサイエンティストやマーケティング部門からの粒度の異なる様々なデータ要求にタイムリーに答えることは非常に困難です。
またユーザ部門が保有する(精度の低い)ちょっとしたデータをすべてデータレイクに蓄積することも現実的ではありません。

その結果、データサイエンティストやマーケティング部門は、データレイクから抽出した汎用的なデータをもとに、スプレッドシート上で、手作業もしくはマクロを駆使して、データを加工する作業を強いられています。

Talend Data Preparation Desktopはデータサイエンティストやマーケティング部門の担当者など、データに慣れ親しんでいるビジネスユーザ向けのデータクレンジングツールです。Talend Data Preparation Desktopを使用することで、ユーザは自身のデータ加工手順を「レシピ」として保存することができます。保存したレシピはDesktop上で繰り返し実行することもできますし、ジョブ開発者と共有して、ETLジョブからレシピを呼び出して実行できます。

Talend Data Preparation Desktopを活用することで、従来までは属人的であった現場でのデータ加工手順をレシピとして保存し、システムから利用する事が可能です。

機能詳細

ジョブ開発

ジョブ開発者は、Java統合開発環境であるEclipseをベースとしたビジュアル開発ツール「Talend Studio」を使用して、コンポーネントの配置とプロパティ設定を中心としたジョブ開発を行います。

Talendにはデータアクセスや業務ロジックを実現するために900種を超えるコンポーネントが用意されており、これらのコンポーネントを組み合わせることで、様々なデータにアクセスするジョブの実装を行います。コンポーネントの組み合わせだけでは実現が難しい複雑なビジネスロジックを実装するために、独自のコンポーネントを開発するためのインターフェースや、JavaコードやSQLを直接記述できるコンポーネントも用意されており、柔軟かつ生産性の高い開発を行えます。

データ入出力のマッピングも専用のGUIを用いて行います。データマッピングを行う際、複数テーブルのジョインや異なるデータの連結、計算処理を実装することもできます。

開発したジョブデザインやデータアクセスに関するメタデータなどは専用のリポジトリに格納し、開発チームでの共有、修正履歴の管理を行うことができます。使用するリポジトリとしてSVNもしくはGithubを選択できます。

ジョブ運用管理

Talend Studioで開発した様々なジョブを効率的に運用管理するため、Talend Administration Center(以下TAC)という運用管理サーバを提供しています。TACでは開発したジョブのデプロイ、実行タイミングのスケジュール、ジョブの実行順序や並列度などの設定と実行状態および実行結果のモニタリングをWebベースのアプリケーションから行えます。

また、運用管理サーバとは別にジョブ実行サーバを構築することで、複数ジョブを負荷分散して実行し、ジョブ実行サーバの障害時には別サーバにロードバランスしてジョブを実行するなど、ジョブ運用の耐障害性を高めることが可能です。

製品エディションおよびライセンス

Talend製品は、利用可能な機能に合わせて幾つかのエディションが用意されています。

Big Data Data
Services
Real-time
Big Data
ファイル、RDBMS、クラウド、Hadoopなど多様なデータソースとのETL連携
メタデータ管理、ジョブデザインのチーム共有、ソース履歴管理機能
 ジョブのスケジュール実行、ジョブネット作成、運用監視、レポート機能
ジョブ実行の高可用性(フェールオーバ、ロードバランス)
ビッグデータバッチジョブ(Map Reduce、Spark)の開発
アプリケーション連携、メッセージング処理(ESB)
データクレンジング(プロファイリング、標準化、ファジーマッチング、データマスキングなど)
ビッグデータストリーミング(Spark Streaming)ジョブ開発機能
 メーカSLAに基づく製品サポート(サブスクリプション契約に含む)

価格

Talend製品を直接使用する(ジョブの開発・運用を行う)ユーザ数に基づいた年間サブスクリプション契約です。ご提供価格については、別途お問い合わせください。