AIスタートアップが市場で「最速のデータ処理エンジン」を立ち上げました
AIスタートアップが最速のデータ処理エンジンを立ち上げました
パリに拠点を置き、女性が創設したAIスタートアップのPathwayは、データ処理エンジンの一般公開を発表しました。報道によれば、既存のストリーミングソリューションよりも最大90倍高速であり、「市場で最速のデータ処理エンジン」であることを約束しています。
その秘密は、バッチとストリーミングのロジックを同じワークフローで混合する独自の能力にあり、システムがもはや役に立たないものを忘れることができます。基本的には、これは人間のようにリアルタイムで変化に対応し、学習することができるということを意味します。
従来、バッチとストリーミングのアーキテクチャを構築する複雑さにより、両方のアプローチの間に分断が生じていたとPathwayのCEO兼共同創設者のZuzanna Stamirowskaは述べています。
これにより、データストリーミングのAIシステムの採用が遅れ、そのインテリジェンスが一時的なものに固定されることになったと彼女は付け加えています。ましてや、生成型AIのような第三のワークフローの複雑さもあります。
Stamirowskaによれば、迅速なデータ処理とより適応性のあるAIが現在「重要なニーズ」となっています。彼女は「それが私たちのミッションであり、バッチ、ストリーミング、またはLLMシステムで作業しているかどうかに関係なく、開発者にシンプルな体験を提供することです」と述べています。

AIの再トレーニングなしでデータポイントを修正する
過去には、モデルが静的データアップロードでトレーニングされているため、リアルタイムで間違った情報や時代遅れの情報を「忘れる」ということはほぼ不可能でした。従来の学習解除にはモデルの再トレーニングが必要でした。
実際、私たちは楽しみ半分でChatGPTに質問を投げかけたところ、「間違った情報を忘れることができますか」という質問に対して次のような回答が返ってきました:
「私はAI言語モデルなので、情報を人間と同じように「忘れる」という能力を持っていません。
しかし、OpenAIの開発者と研究者は、新しいデータや改善に基づいてモデルを更新および再トレーニングすることができます。」
しかし、Pathwayは、Excelドキュメント内の1つのセルの値を更新するようなバッチデータのアップロードを必要とせずに、特定のデータポイントを修正することができると述べています。更新されたセルはドキュメント全体を再処理するのではなく、それに依存するセルのみを処理します。
スタートアップの既存のクライアントであるドイツの物流専門企業DB Schenkerは、異常検出分析プロジェクトの市場投入までの時間を3か月から1時間に短縮しました。一方、フランスの郵便サービス会社La Posteは、艦隊のCAPEX削減率を16%に減らしました。
開発者のための「共通語」
ポーランドとフランスのデュオであるStamirowska氏と同社のCOOであるClaire Nouetは、2020年にPathwayを設立しました。これまでに、このスタートアップは昨年12月の事前シードラウンドで450万ドル(約400万ユーロ)を調達し、ヨーロッパと北米で20人以上の従業員を抱えています。
この女性主導のディープテックスタートアップは、システムがすべてのデータパイプライン(ストリーム、バッチ、生成型AI)の「共通語」となることを目指しています。クライアントのコスト削減に加えて、従来は専門的なスキルセットが必要だったストリーミングワークフローの設計能力を開発者に民主化することを目指していると述べています。