Tasks
Stance classification task
Stance classification task aims at estimating politician's position from politician's utterances. In PoliInfo2, system participating in the task estimates the stances of political parties from the utterances of the members of the Tokyo Metropolitan Assembly. Given the Tokyo Metropolitan Assembly, topics (agenda), member's list and political denomination list, and the systems classify their stance into two categories (agree or disagree) for each agenda.Dialog summarization task
Dialog summarization task aims at summarizing the transcript of local assembly, taking the structure of dialogue into account. In PoliInfo2, systems participating in this task summarize the transcript based on the dialogue structure, which consists of “Members' questions” and “Governor's answer”. Given the transcript and summary conditions (speaker name and number of summary characters etc), they generate the structured document.Entity linking task
Entity linking task aims at identifying political terms included in politicians' statements, and is to resolve mention recognition, disambiguation and linking the mention with the knowledge base. In PoliInfo2, Entity linking is the task of assigning a unique identity of "legal name" which is one of the political terms. Given local assembly member's utterances, and systems extract a mention of “law name” and link the mention with the list of law names or Wikipedia.Dialog Topic Detection
新型コロナウィルス感染症(COVID-19)による問題を解決するためは、国や地方自治体における対策を、いかに早く適切に地域住民に伝えられるかが重要である。QA Lab-PoliInfo-2では、このような事態における情報技術の可能性を検討するために、地方議会会議録を対象とした3つのタスク(Stance Classification, Dialog Summarization, Entity Linking)に続く第4のタスク(Topic Detection)を行う。
Leader board
Formal run (2020年7月6日から7月31日まで)の結果
Dialog Summarization task
ID | Team Name | Comment | JSON | Datetime | ROUGE-1-R 内容語のマクロ平均 |
---|---|---|---|---|---|
189 | JRIRD | 外部の学習データを追加。 | download | 2020-07-28 10:30:00 | 0.3208 |
185 | JRIRD | データ更新に対応。プログラムのバグ修正。 | 2020-07-27 10:30:03 | 0.2980 | |
195 | JRIRD | 不要な部分の出力を抑止。 | download | 2020-07-29 10:15:10 | 0.2980 |
216 | nukl | 文選択だけでなく,文短縮にもランダムフォレストを適用.それ以外はID187と同じ. | download | 2020-07-31 23:38:18 | 0.2581 |
148 | TO | NLP2020で発表した結果 | download | 2020-07-09 11:35:41 | 0.2436 |
215 | Forst | サブストリング選択手法の見直し | download | 2020-07-31 22:27:36 | 0.2410 |
187 | nukl | ID161と同じ手法.再学習とバッグの修正. | download | 2020-07-27 21:25:17 | 0.2387 |
161 | nukl | ID148と同様の手法だが,学習データを前回のものから,PoliInfo2 のSegmentedなデータを使ったものに変更. | download | 2020-07-15 14:40:45 | 0.2274 |
172 | nukl | 161から、要約元の範囲推定の手法を変更。 | download | 2020-07-24 14:31:25 | 0.2198 |
200 | Forst | バグ修正 | download | 2020-07-29 23:24:24 | 0.2145 |
194 | Forst | サブストリング分割手法の見直しと、セグメンテーションのバグ修正 | 2020-07-28 23:23:06 | 0.2093 | |
157 | TO | ID148 と同じ要約元に対し,sumy (https://pypi.org/project/sumy/) の TextRank を適用したもの. | download | 2020-07-13 14:20:58 | 0.1331 |
208 | wfront | 抽出型要約テスト(改良を試みたもの) | download | 2020-07-31 11:38:28 | 0.1171 |
151 | TO | ID148 と同じ要約元に対し,sumy (https://pypi.org/project/sumy/) の LexRank を適用したもの. | download | 2020-07-10 16:11:08 | 0.1164 |
181 | wfront | 抽出型要約テスト(API経由) | download | 2020-07-26 18:20:50 | 0.1058 |
176 | Forst | 要約すべきパッセージのいくつをいくつかのサブストリングにわけ、それらとパッセージ自体の類似度を計測した。類似度には、分散表現を用いたコサイン類似度を用いた。
類似度の高いサブストリングを抽出し、要約 とした。 | 2020-07-24 22:18:45 | 0.0782 | |
184 | Forst | MMRとセグメンテーションの改善 | 2020-07-26 23:04:00 | 0.0729 | |
211 | SKRA | Our method is extractive summarization based on EmbedRank++ WITHOUT annotated dataset. We apply it i nto summarization with Siamese BERT Network, which we originally implemented with provided minutes dataset. | 2020-07-31 13:03:38 | 0.0696 | |
206 | LIAT | 分類器による抽出型要約 | download | 2020-07-31 04:47:55 | 0.0555 |
Formal run 後(2020年8月1日以降の結果) |
過去のバージョン: v20200605(~7月4日の結果) |
Stance Classification task
ID | Team Name | Comment | JSON | Datetime | Accuracy |
---|---|---|---|---|---|
175 | wer99 | 会議録から賛否をルールベースで予測、ternaryを追加(非明示的なものも予測) | 2020-07-24 21:36:15 | 0.9976 | |
177 | wer99 | ルールベースで抽出する対象範囲を調整 | 2020-07-25 00:42:05 | 0.9976 | |
202 | wer99 | 手法の細かい調整、ternaryの出力範囲の見直し | 2020-07-30 21:18:45 | 0.9976 | |
191 | wer99 | 会議録からルールベースで賛否を予測、手法の細かい調整を行った | 2020-07-28 19:16:23 | 0.9970 | |
196 | wer99 | 手法の細かい調整を行った | 2020-07-29 14:24:37 | 0.9952 | |
186 | wer99 | 手法のチューニングを行った | 2020-07-27 20:35:06 | 0.9923 | |
182 | wer99 | ルールベースで抽出する対象範囲を調整、一部について機械学習手法を使用 | 2020-07-26 18:44:31 | 0.9910 | |
205 | Ibrk | 細部を修正 | 2020-07-31 02:05:17 | 0.9650 | |
180 | Ibrk | エラーを修正 | 2020-07-26 01:26:37 | 0.9644 | |
149 | Ibrk | 定例会の本会議から会派ごとの賛否をルールベースを用いて判定 | 2020-07-09 11:38:39 | 0.9600 | |
167 | Ibrk | 議案出力の方式を修正 | 2020-07-17 09:51:29 | 0.9598 | |
203 | knlab | バグを修正 | 2020-07-30 22:21:36 | 0.9531 | |
214 | knlab | 出力形式の変更 | 2020-07-31 22:03:06 | 0.9531 | |
199 | knlab | バグを修正 | 2020-07-29 22:52:56 | 0.9529 | |
158 | knlab | ルールベースと機械学習による手法 | 2020-07-13 21:06:57 | 0.9520 | |
160 | knlab | エラーを修正 | 2020-07-14 03:30:43 | 0.9520 | |
156 | akbl | 賛否を明らかにする議員の発言内容の口上部分のみをルールベースで処理したもの | 2020-07-12 21:30:45 | 0.9498 | |
204 | akbl | ID198とTernaryの出力を一部修正 | 2020-07-30 23:27:02 | 0.9498 | |
218 | akbl | ベースラインをBERTとして判定できなかったものをルールベースで処理したもの | download | 2020-07-31 23:46:51 | 0.9496 |
198 | akbl | 既存のルールベースで賛否が取れなかった一部会派の発言内容をBERTで二値判定したもの | 2020-07-29 22:34:40 | 0.9492 | |
153 | wer99 | データ更新に対応。その他、ルールベースの処理を一部改善 | 2020-07-10 22:55:31 | 0.9481 | |
154 | wer99 | 一部ルールの処理を修正。処理内容は前回までとほぼ同じで、主に議事録を用いたルールベースによる処理を行い、テスト時のスコアを確認するために一部を調整 | 2020-07-11 14:39:36 | 0.9461 | |
193 | knlab | 特徴量を変更 | 2020-07-28 23:15:17 | 0.9452 | |
169 | akbl | ID156のルールベースを使用せずに, BERTで議員の発言内容の口上部以外の討論文を対象に二値判定(賛成or反対)したもの | 2020-07-21 00:21:46 | 0.9399 | |
171 | Forst | ProsConsListTernaryについて言及の有無を表示 | 2020-07-23 18:13:33 | 0.9388 | |
164 | Forst | ルールベースでの手法 | 2020-07-16 11:46:49 | 0.9382 |
Formal run 後(2020年8月1日以降の結果) |
過去のバージョン: v20200605(2020年6月5日~7月4日の結果) | v20200522(2020年5月22日~6月4日の結果) | v20200310(2020年5月21日以前の結果)
Entity Linking task
ID | Team Name | Comment | TSV | Datetime | End to End (メンション抽出+曖昧性解消)のF値 |
---|---|---|---|---|---|
212 | HUHKA | 抽出した固有表現に対しfileterをかけ、201と同様に曖昧性解消を行う。 | 2020-07-31 18:51:22 | 0.6035 | |
201 | HUHKA | 174の辞書ベースで曖昧性解消できるものは辞書ベースで行う。それ以外のものは155の共起頻度で行う。 | 2020-07-30 20:08:16 | 0.4887 | |
155 | HUHKA | 曖昧性解消を共起頻度で行う | 2020-07-11 17:55:43 | 0.4747 | |
174 | HUHKA | 曖昧性解消を辞書ベース(e-Govの法律名・略称)で行う | download | 2020-07-24 21:18:27 | 0.4468 |
197 | HUHKA | 174で用いたe-Govの法律名・略称のうち、正式名称がwikipediaにあるもののみに限定 | 2020-07-29 20:30:50 | 0.4468 | |
150 | HUHKA | 固有表現抽出:BERT 曖昧性解消:wikipedia2vec | 2020-07-09 13:49:41 | 0.4049 | |
192 | HUHKA | 曖昧性解消:共起頻度+wikipedia2vec | 2020-07-28 21:54:18 | 0.3980 | |
217 | Forst | ID183にRNNで構成したBinary分類器の学習設定を修正/学習データ型を修正/メンション抽出でのルール修正 | 2020-07-31 23:40:15 | 0.3910 | |
183 | Forst | メンション抽出:既存のルールベース処理にRNNを適用して予測する処理を追加したもの | 2020-07-26 22:59:19 | 0.3656 | |
147 | Forst | 処理を少し修正 | 2020-07-09 00:21:32 | 0.3389 | |
166 | HUHKA | 曖昧性解消をwikipediaのタイトルとのexact matchで行う。一致しないものはNILを出力。 | 2020-07-16 14:25:21 | 0.3247 | |
146 | Forst | ルールベースで処理 | 2020-07-08 15:23:49 | 0.3089 | |
173 | selt | MD: BERT, ED: wikipedia2vec | 2020-07-24 14:54:04 | 0.2980 | |
178 | selt | MDに用いたBERTの学習epochを変更 | 2020-07-25 02:03:21 | 0.2978 | |
179 | selt | epoch数変更 | 2020-07-26 00:08:17 | 0.2978 | |
213 | selt | EDに辞書ベース手法を追加 | 2020-07-31 18:55:36 | 0.2930 | |
190 | nukl | 固有表現抽出を辞書ベース(日本法令索引の法律名・通称)で行う | 2020-07-28 17:52:44 | 0.2375 |
Formal run 後(2020年8月1日以降の結果) |
過去のバージョン: v20200310(~7月4日の結果) |
Information
Schedule
July 12th 2019:Task Registration DueSep 30th 2019: | NTCIR-15 Kickoff Event in NII, Tokyo |
---|---|
Oct 18th 2019: | First Round Table Meeting in NII, Tokyo |
Dec 10th 2019: | Second Round Table Meeting in NII, Tokyo |
Dec 15th 2019: | Registration Start |
Feb 15th 2020: | Dataset Release * |
Mar 16th 2020: | |
Apr 23rd 2020: | First online round table meeting using zoom |
Apr 30th 2020: | |
May 7th 2020: | Dry Run* |
May 27th 2020: | Second online round table meeting using zoom |
Jun 27th 2020: | Third online round table meeting using zoom |
Jun 30th 2020: | Submission Deadline for Dry Run |
Jun 1st-12th 2020: | Update of dataset |
Jul 12th 2020: | |
Jul 13th 2020: | Formal Run |
Jul 31st 2020: | Deadline for registration |
Jul 31st 2020: | Submission Deadline for Formal Run |
Aug 1st – 7th 2020: | Evaluation by participants |
Aug 8th – 14th 2020: | Evaluation by organizers |
Aug 15th 2020: | Evaluation Result Release |
Aug 26th 2020: | Fourth Online Round Table Meeting |
Sep 1st 2020: | Task over view paper release (draft) |
Sep 2020: | Submission deadline of participant papers (draft) |
Nov 1st 2020: | Camera-read participant paper submission deadline |
Dec 8th-11th 2020: | NTCIR-15 Conference & EVIA 2020 in NII, Tokyo |