入力された本文から、自然で読みやすい見出し・要約文を手軽に生成。新幹線の速報テロップ等で実用化されている独自の機械学習技術により、文字数や文書スタイルの指定も可能。各種媒体へのPR文書の出し分けや、大量の文書の内容を効率的に把握したい時などに、幅広くご活用いただけます。
2022/11/11をもって試用APIキー提供を終了しました。すでに試用APIキーをお持ちの方は引き続きご利用いただけます。
かんたんに本APIの機能をお試しいただける「朝日新聞Playground」をリリースしました。ぜひご活用ください。
自動要約生成API TSUNA(Text SUmmarizatioN Application)は、入力された記事本文を機械学習を用いて要約し、見出しや要約文を生成するものです。
朝日新聞が大量に保有している過去30年分の記事データを、効率よく処理させるために前処理・フィルタリングをした上で、ディープラーニングの機構を用いて学習させています。
本APIは出力する見出しや要約文の長さをコントロールできるのが特徴です。これは、掲載するメディアによって文字数制限がある場合が多いため、実用上必要な技術として注目しています。さらに、利用する状況に合わせ、同時に複数の候補を出力することもできます。出力された複数の見出しから、ユーザーが取捨選択した上でより良い見出しに修正をする、などのシチュエーションでの利用が考えられます。
朝日新聞社メディア研究開発センターでは、自動見出し生成の研究を2016~2017年に株式会社レトリバと進めました。本APIにはその共同研究の成果を進化させ、メディア研究開発センター独自のノウハウが活かされています。
教師データのスタイルを学習することで、例えば「体言止め」、「スペースの有無」、「文体(です・ます調、だ・である調)」のような特徴が再現されます。※教師データの性質によっては、スタイルが正確に反映できない場合もあります。
最大1,000文字(製品版)の本文から、指定した文字数で、複数の見出し・要約文案の 生成が可能。文脈や媒体のトーン&マナーにふさわしい生成結果をご利用いただけます。
高品質な要約文生成のためには100万件規模の教師データが必要となりますが、TSUNAは朝日新聞社で蓄積した大規模データ(約500万件)を組み合わせて学習する独自技術(※)により、数万件程度の小規模な教師データにも対応可能です。
(※)人見雄太ら、小規模リソースにおける生成型要約のためのスタイル転移. 言語処理学会第26回年次大会, A4-1, March 2020.
本APIは、記事本文の入力に対して、自動で見出しや要約を生成します。
九州電力玄海原発3、4号機(佐賀県玄海町)の運転差し止めを住民らが求めた仮処分申し立ての即時抗告審で、福岡高裁(山之内紀行裁判長)は10日、住民側の抗告を棄却した。主な争点は、耐震設計の基になる基準地震動(想定される最大の揺れ)の合理性、原発周辺の火山の噴火リスク、配管の安全性の3点。 住民側は「基準地震動が過小評価されている」と主張。原子力規制委員会の安全審査の内規(火山影響評価ガイド)は、破局的噴火が予測できることを前提としている点は不合理と指摘。阿蘇カルデラ火山の噴火による火砕流が原発の敷地に到達する可能性も、十分小さいとは言えないと訴えていた。配管については「九電の検査方法では損傷が見逃されることがありうる」としていた。九電側は、基準地震動の評価について「各種調査で地域的な特性を把握した上、過小にならないようにしており合理的だ」と反論。「原発の運用期間中に破局的噴火が起きる可能性は極めて低い」と主張していた。配管については「健全性の確保に向け万全を期している」としていた。佐賀地裁は2017年6月、「安全性に欠けるところがあるとは認められない」などとして、仮処分の申し立てを却下。住民側が即時抗告していた。
かんたんに本APIの機能をお試しいただける「朝日新聞Playground」をリリースしました。ぜひご活用ください。
導入を検討したい/デモを触ってみたいなど、TSUNAに関するご相談はこちらで受け付けております。