API & DATA

自動見出し生成API

自動見出し生成API

本APIは、入力された記事本文を機械学習を用いて要約し、見出しを生成するものです。過去30年分の記事データをディープラーニングの機構を用いて学習させています。期間限定の評価版となりますが、活用方法や導入についてぜひご検討下さい。

概要

本APIは、入力された記事本文を機械学習を用いて要約し、見出しを生成するものです。

朝日新聞が大量に保有している過去30年分の記事データを、効率よく処理させるために前処理・フィルタリングをした上で、ディープラーニングの機構を用いて学習させています。

本APIは出力する見出しの長さをコントロールでき、ユーザーが指示した文字数に合わせて見出しを生成することが特徴です。これは、見出しを掲載するメディアによっては、見出しの長さに厳しい文字数制限がある場合が多いため、実用上必要な技術として注目しています。また、長さの推測自体も出力エンジンに任せて出力させることも可能です。さらに、利用する状況に合わせ、同時に複数の見出しを出力することもできます。出力された複数の見出しから、ユーザーが取捨選択した上でより良い見出しに修正をする、などのシチュエーションでの利用が考えられます。

自動見出し生成は、一つの記事に対し、複数のバリエーションの見出しを付与したり、大量のコンテンツに一気に見出しをつける、見出しのついていない長文の内容をひと目で把握する、などの用途で期待されている技術です。朝日新聞社メディアラボでは、自動見出し生成の研究を2016年より株式会社レトリバと進めています。本APIにはその共同研究の成果に、さらにメディアラボ独自のノウハウが活かされています。

しかし、出力はまだまだ完璧なわけではありません。学習データが朝日新聞の記事のみであるため、新聞記事のスタイルから大きく逸脱したもの、例えばインタビューや、「ですます調」の入力では、高い確率で破綻することがわかっています。また、本文中に出てこないような意図しない固有名詞や、朝日新聞特有の表現が出てきてしまうこともあります。公開のモデルはパラメータも制限しています。今回の公開は、用途などの検証のためのものですので、ご利用に関してはご注意や、「利用規約」を十分ご確認の上、ご利用頂きたくお願い致します。また、エラーのご報告やお問い合わせ、商用利用に関してはカスタマイズやご相談も受け付けております。

現在のモデルバージョン

モデルは皆様から頂いた声を反映させ、随時更新していきます。

  • Ver. 0.2: 2019年5月21日 ベータ版リリース
  • Ver. 0.1: 2019年3月12日 ベータ版リリース

リファレンス

本APIは、記事本文の入力に対して、自動で見出しを生成します。

入力

米ホワイトハウスは18日、トランプ大統領と北朝鮮の金正恩朝鮮労働党委員長による2回目の米朝首脳会談が2月下旬に開かれることを明らかにした。開催場所は未定。トランプ氏が正恩氏の最側近、金英哲党副委員長と約1時間半会談して決まった。

出力(26文字指定時)

  • 米朝首脳会談、2月下旬に開催 トランプ・金英哲委員長
  • 米朝首脳会談、2月下旬に開催 トランプ氏と北朝鮮会談
  • 米朝首脳会談、2月下旬に開催 トランプ大統領と北朝鮮
  • 米朝首脳会談、2月下旬に開催 トランプ大統領と会談で
  • 米朝首脳会談、2月下旬に開催 トランプ大統領・北朝鮮

エンドポイント

URL:https://clapi.asahi.com/headline-generation

method:POST

レスポンス: JSON

リクエストパラメータ

パラメータ名 説明 サンプル 制約 必須
text 記事本文を指定します。 米ホワイトハウスは18日、トランプ大統領と北朝鮮の金正恩朝鮮労働党委員長による2回目の米朝首脳会談が2月下旬に開かれることを明らかにした。 最長で1000文字まで。それを超える入力は内部処理でトリミングされます。
length 出力文字数を指定します。 26 0または8以上40以下で指定。0は指定なし(デフォルト値。本APIが長さも推測します)。範囲から外れた値が設定されている場合はエラーします。 -
n_head 出力する見出しの数を指定します。 5 1以上10以下で指定。デフォルトは1。範囲から外れた値が設定されている場合はエラーします。 -

レスポンス

フィールド名 説明 サンプル 返却条件
message 処理メッセージ。下記参照。 ok string 常に返却
headline 出力見出し ["来月米朝首脳会談開催","米朝会談、2月下旬に","米朝首脳会談、2月下旬","米朝首脳会談、2月に","米朝首脳会談、来月に"] list messageがokのときのみ

メッセージ

message HTTP Status 説明
ok 200 正常応答
forbidden 403 メソッドが不正
bad parameters 400 パラメータが不正
Missing Authentication Token 403 APIキーが不正
Internal server error 500, 503 サーバ処理で異常が発生
Limit Exceeded 429 アクセス数の制限を超過(1日50アクセス)

サンプルリクエスト

正常時

- Request
curl https://clapi.asahi.com/headline-generation -X POST --header 'x-api-key:<APIKEY>' -d "text=米ホワイトハウスは18日、トランプ大統領と北朝鮮の金正恩朝鮮労働党委員長による2回目の米朝首脳会談が2月下旬に開かれることを明らかにした。開催場所は未定。トランプ氏が正恩氏の最側近、金英哲党副委員長と約1時間半会談して決まった。&length=10&n_head=5"
- Response
{"message":"ok", "headline":["来月米朝首脳会談開催","米朝会談、2月下旬に","米朝首脳会談、2月下旬","米朝首脳会談、2月に","米朝首脳会談、来月に"]}

異常時

- Request
curl https://clapi.asahi.com/headline-generation -X POST --header 'x-api-key:<APIKEY>' -d "text=米ホワイトハウスは18日、トランプ大統領と北朝鮮の金正恩朝鮮労働党委員長による2回目の米朝首脳会談が2月下旬に開かれることを明らかにした。開催場所は未定。トランプ氏が正恩氏の最側近、金英哲党副委員長と約1時間半会談して決まった。&length=10&n_head=100"
- Response
{"message": "bad parameters"}

ご注意・制限事項

  • 本APIは期間限定の公開で、評価版となります。
  • 1APIキーに対して、1日50回までのご利用が許可されています。また、公開は2019年6月末までを予定しています。
  • 商用では利用できません。商用利用をご検討の際は、お問い合わせフォームよりご連絡をお願い致します。
  • 出力された見出しは、必ずしも事実関係や文法が正しいわけではなく、破綻している場合もありますので、十分にご確認の上、ご利用ください。弊社は出力された内容に関して一切の責任を放棄致します。
  • 文字数を指定された場合でも、必ずしもその文字数が守られて出力されるわけではありません。場合によっては指定した文字数よりも短かったり、長かったりする場合がございます。
  • 入力する記事については、個人情報を含むものや、利用者または弊社が著作権を持つもの以外は送信しないでください。

以上について、詳しくは「利用規約」をご確認ください。

デモ

APIキー取得の上、下記のフォームで見出し生成をお試しいただけます。

APIキー

長さ制限

出力数

記事本文(8文字以上)

送信

結果は下記に表示されます。

送信ボタンを押してください…