Adobe PDF Extract API によりPDF をテキスト自動抽出するスピードと精度が向上

三菱UFJトラスト投資工学研究所

株式会社KATACHI

創業

1988年

従業員数:45名(2022年4月1日現在)

 https://www.mtec-institute.co.jp/

導入製品:

Adobe PDF Extract API

checkbox icon

課題

PDF し、

graph icon

成果

・事OCRで、

・文書構造を維持したデータ抽出により文意を含めた分析が可能に

・より精度の高い調査が可能となり事業のさらなる成長に寄与

・分析・検証サイクルのスピード向上に貢献


 

 「文章構造を維持したテキスト抽出の実現は、金融データサイエンスの世界でも大きな意義があると考えています」

 

 研究部 開発第2グループ フィナンシャルエンジニア

 

 成富 佑輔氏


 デは、る。中、数理・情り、UFJは、目。PDFAdobe PDF Extract APIは、え、る。

 自然言語までを分析対象に進化を続ける金融データサイエンス

き、UFJ 資・融UFJ (以下、MTEC)は、る。を、 る。

「やは、め、金融す」

が、PDF を、た。

「以使PDFが、り、た。し、ないが、これん。PDFは、」(成富氏)

エンゲージメント開発部  エンゲージメント開発グループ 楠田 亜沙子氏

 研究部 開発第2 グループフィナンシャルエンジニア

 成富 佑輔氏

エンゲージメント開発部  エンゲージメント開発グループ 楠田 亜沙子氏

研究部 開発第1グループ主任フィナンシャルエンジニア

清水 正大氏

文章構造の維持を唯一謳うAdobe PDF Extract API のトライアルを実施

PDF 中、MTECが、Environment()、Social()、Governance(ガス)のESGた。ESGだそのは、い、つ。は、(CSR)、た。は、た。は、Adobe PDF Extract API

 

し、た。PDFが、り、Adobe PDF Extract API」(成富氏)

分析・検証サイクルのスピード向上に貢献

は、る。 1 る。

 

ESGす。に、は、し、す。め、

 

AI・機Adobe SenseiAdobe PDF Extract API 2021MTEC き、る。中、MTECて、PDFOCRし、た。

 

PDFが、OCRAdobe PDF Extract APIす。Amazon S3PDFAcrobat ProOCRし、Adobe PDF Extract APIJSONす。OCRは、PDFれ、Acrobat Proす。は、OCRし、析・」(成富氏)

 

JSONは、る。

 

 は、PDFは、り、た。Adobe PDF Extract API く、す。も、 SDGs17し、SDGs か、す。 で、」(清水氏)

統合報告書だけでなく、多様なPDFファイルからのテキスト抽出に活用

MTECは、Adobe PDF Extract APIだ。た、PDFる。

 

は、JPX(日プ)がTDnet(す。た、JPX4000CSRす」(成富氏)

 

さらに、親会社である三菱UFJ信託銀行をはじめとするグループ企業へのサービス展開も検討中だ。

 

合、す。は、」(清水氏)

 

Adobe Document Serviceは、Adobe PDF Extract APIか、Document Generation APIPDF Services APIだ。後、Adobe Document Serviceう。

 

※掲載された情報は、2022年9月取材現在のものです。

関連するユーザー事例