TCSE は TED Talk のトランスクリプトの検索に特化したサーチエンジンです。教育と研究での使用を目的として開発されました。TCSE は TED がかつて開発者向けに公開していたAPIを用いたサービスとしてスタートしました。TCSE は TED のデータを Creative Commons BY-NC-ND license のもとに使用していますが、TED による公式のサービスではありません。
変更履歴 | おことわり | ドキュメント(旧版)
TCSE は 長谷部陽一郎 が開発しました。学習、教育、研究のために自由に使っていただけます。論文や研究発表で TCSE を使用したときには下記を参考文献に入れてください。
TCSEのバージョン | 10.0.4 |
データ処理の日付 | December 24, 2023 |
英語トランスクリプトの品詞解析・統語解析 | spaCy 3.72 |
トーク数 | 5,305 |
セグメント数 | 1,164,910 |
拡張セグメント数 | 546,023 |
語彙要素数 | 10,580,358 |
語彙項目数 | 98,922 |
Arabic | 5,230 talks |
Bulgarian | 2,281 talks |
Burmese | 1,586 talks |
Chinese, Simplified | 5,141 talks |
Chinese, Traditional | 4,897 talks |
Croatian | 2,023 talks |
Czech | 1,733 talks |
Dutch | 3,091 talks |
French | 5,130 talks |
German | 3,202 talks |
Greek | 3,140 talks |
Hebrew | 4,055 talks |
Hindi | 1,011 talks |
Hungarian | 3,479 talks |
Indonesian | 3,123 talks |
Italian | 4,641 talks |
Japanese | 4,299 talks |
Korean | 4,943 talks |
Kurdish | 1,288 talks |
Northern Kurdish | 1,116 talks |
Persian | 3,831 talks |
Polish | 3,624 talks |
Portuguese | 4,597 talks |
Portuguese, Brazilian | 4,859 talks |
Romanian | 3,668 talks |
Russian | 4,586 talks |
Serbian | 2,865 talks |
Slovak | 1,107 talks |
Spanish | 5,253 talks |
Swedish | 1,295 talks |
Thai | 2,175 talks |
Turkish | 4,673 talks |
Ukrainian | 2,258 talks |
Vietnamese | 4,618 talks |
「ずれ」が生じる場合の調整方法
アドバンスト・サーチは英語トランスクリプトだけが対象になります
主要な品詞({verb}
, {noun}
, {adjective}
, {adverb}
)の指定は短縮形を用いることができます({v}
, {n}
, {j}
, {r}
)。アドバンスト・サーチの検索キーをを品詞指定の文字列のみで構成することはできません。
基本形(LEMMA) | [LEMMA] |
品詞(POS) | {POS} |
表層形(SURFACE)+品詞(POS) | SURFACE{POS} (with no spaces in-between) |
基本形(LEMMA)+ 品詞(POS) | [LEMMA]{POS} (with no spaces in-between) |
論理和 (OR) | A|B |
セグメントの最初 | ^ |
名詞チャンク | _ |
否定マッチ | -X |
ワイルドカード(あらゆる1語にマッチ) | -_ |
ワイルドカード(連続する0語以上にマッチ) | * |
[excite] |
excite, excites, excited, exciting |
{noun} |
すべての名詞 |
{verb} |
すべての動詞 |
to * surprise |
to our surprise to his surprise, etc. |
[read] {det} [news|paper|article] |
they read these articles reading the paper or something I'm reading the news at six, etc. |
^ having {verb} |
Having started the process, Having said that, etc. |
[help]{noun} |
an aunt offered financial help, we called people for help, etc. |
[get] -rid of |
get outside of get ahead of got tired of, etc. |
[make] _ -_ |
made a bad design good. make this happen. make your life miserable., etc. |
[give] _ _ |
give you an example gave her a gift give the government any further excuse, etc. |