Unstructured.io、大規模な言語モデルのためのデータアクセス課題に取り組む(TechCrunch)

from TechCrunch

Unstructured.ioは、Primer AIの元従業員によって設立されたスタートアップで、OpenAIのGPT-4のような大規模な言語モデル(LLM)のためのファーストパーティや独自のデータにアクセスするという課題に対処することを目的としている。

多くの企業がLLMの採用をためらっているのは、この種のデータにアクセスできないからだ。LLMはファイアウォールの内側にあり、LLMが利用できない形式になっていることが多い。Unstructured.ioは、LLMが理解し活用できる方法で企業データを抽出し、段階化するプラットフォームを提供する。

同社は、ウェブページから広告を削除したり、スキャンしたページで光学式文字認識を実行したりするなど、LLMの取り込み用に企業データをクリーンアップして変換するツールを提供している。Unstructured.ioは防衛機関と密接な関係があり、米空軍と米宇宙軍から契約を獲得している。

同社は最近、シリーズAおよびシード資金調達ラウンドで2500万ドルを調達した。


*Disclamer:本キュレーションはTechCrunchからピックおよび自動生成されました。正確な内容や詳細を知りたい方はリンク先の元コンテンツをご覧ください。

+ キュレーション元の記事を読む