ChatGptでファイルアップロードし、テキスト抽出を行う

2023年9月19日

ChatGPT Advanced Data Analysisでファイルアップロード機能が利用可能に

有料ユーザーの早期機能アクセスにより、⁠Advanced Data Analysis⁠が利用可能になっています。この機能を利用することで、ファイルをアップロードし、ファイルに対してGPTに指示を出すことが出来ます。

以下ではPDFと画像に対してテキスト抽出を試してみました。

画像ベースPDFの抽出依頼

とはいっても、今回検証に利用したPDFは、画像ベースではありますが、テキストの埋め込みデータも持っているため、単純に画像ベースかテキストベースかといった以外の判断もあるのかもしれません。

以下のように日本語で書かれた文章の画像に対してテキストの抽出を依頼しましたが、 ⁠日本語のテキスト抽出に必要なTesseractの言語データファイル（jpn.traineddata）が見当たらない ことが原因で抽出は行えませんでした。

日本語の画像からのテキスト抽出依頼

英語のテキスであれば、PDFから画像を抽出し、その結果からテキストを抽出することは可能なようです。ただし、テキストの位置は期待した結果とはなっていませんでした。

英語の画像ベースPDFからの画像抽出依頼

英語の画像からのテキスト抽出依頼

よかったらシェアしてね！