RECENT POSTS

2015-02-23TCSE 2.0 Released
2015-02-03サイトのリニューアル
2015-02-02TCSE Tips #2
2014-11-27TCSE Tips #1
2014-11-17言語系のゼミ論・卒論執筆に役立つオンライン言語資料

TCSE 2.0 Released

I have been working on TED Corpus Search Engine (TCSE) for about a week to make it more multi-lingual. TCSE 2.0 is capable of searching and showing translation text in 15 languages (left-to-right languages to which more than 1,500 talks have been translated so far).

I think this is good news for many (potential) users of the system, but I would disappoint some of the Japanese users because I have dropped the functionality of advanced search in Japanese. I just wanted to treat Japanese, which was the only translation language available on TCSE of previous versions, as equal to other languages, mainly for reasons having to do with system maintainability.

Since this was relatively a big change and some important bugs were fixed as well, I decided to have the version number jump up to 2.0 from 0.1. I am not 100% confident, though, about the stability and robustness of the new system, which is more complex than before. I might be working on checking and fixing things here and there for sometime. So I apologize in advance for possible temporary service suspension if that has to happen unannounced.

TCSE2_0

サイトのリニューアル

サイトのテーマを変更した。ここ数年でスマホやタブレットが急速に普及し、閲覧環境が一様ではないので、なるべくレスポンシブなデザインということで思い切って1カラムの構成にする。結果、今までで一番シンプルなデザインだろう。視力がずいぶん落ちてきたので、標準のフォントサイズを大きくした。

新しいテーマでのレイアウトを確認しようと古いテキストを眺めていたら、いろいろ思い出されてくる。2004年に始めたので、もう10年以上もやっていることになる。Wayback Machineで検索をかけてみると、2004年当時のサイトのレイアウトを見ることができた。

そういえば、2004年に始めた頃は静的なHTMLのサイトだったが、その後MySQLを導入してPHPやRuby on Railsで自作システムを作成するようになった。最近は、仕事で複数のサイトを管理しないといけないこともあり、もっぱらWordPressを使っている。

職場が変わって引っ越したり、子供が生まれたり、父が亡くなったり、いろいろなことがあった。ブログには内容が古かったり、頭の悪そうなことを言っていたり、よほど削除してしまおうかと思う記事もあるが、それも何かの記録ということで残していく。良いことも悪いことも、ああこの時にはこうだったんだな、とまた思い出すのも悪くないだろう。

yohasebe-com-2004

TCSE Tips #2

Nowadays, there are ways to access web-services and show/fetch data without using the traditional process of typing in the url to your web browser. What I have in mind in particular is use of productivity applications such as Alfred on OSX and Drafts on iOS. These apps allow you to setup a custom search menu that accepts a snippet of text, creates a query URL, and conducts the search.

Now, TED Corpus Search Engine (TCSE) accepts access via urls of a special format which can be easily constructed on these applications. The format is:

http://yohasebe.com/tcse/query/ + search string

So you can set up, for instance, a custom web search on Alfred as follows. Open Preferences on Alfred, go to Web Search, and press Add Custom Search button on the bottom of the panel, and fill in the necessary info into the form like this:

Alfred TCSE Custom Search

If you don’t have Alfred but want to just see how this URL thing works, just click on the link below.

http://yohasebe.com/tcse/query/look+and+see

TCSE Tips #1

Update (November 28, 2014)

Now TCSE plays the video right at the time location where the segments starts, with “play video 10 seconds earlier” option newly added.  (Requested by Mura Nava)


I intentionally set up TED Corpus Search Engine (TCSE) to play the video at the point 10 seconds earlier than the segment in question is actually spoken. Currently I do not have a plan to change this. But if you want to start the video right at the intended time, change the starting time (in milli-seconds) part of the video URL. Here’s how:

  1. Click on the mini clip icon and copy the video URL
  2. Add 10,000 (= 10 seconds) to the number in the middle of the URL
  3. Access the modified URL

For instance, suppose you want to play the following segment in Marco Tempest’s talk titled “And for my next trick, a robot”:

Alan Turing, a pioneer of artificial intelligence, spoke about creating the illusion that a machine could think.

The URL you first find will be:

http://yohasebe.com/tcse/video/1991-51/220860/false/sentence/16/100

Change this to:

http://yohasebe.com/tcse/video/1991-51/230860/false/sentence/16/100

The segment above will be played immediately.

言語系のゼミ論・卒論執筆に役立つオンライン言語資料

この時期、大学4年生はゼミ論や卒論の執筆に忙しく、私のところのゼミ生も必死になって仕上げにとりかかっています。今回その指導のためにオンライン上の言語資料へのリンクをいろいろ集めたので、1つのページにまとめてみました。

なお、学部レベルの学生の利用を想定しているので、無料かつオンラインで使えることを重視して選んでいます。また、手順や操作が複雑そうなものは除外しました(いくつか例外はありますが)。

決して網羅的ではないのですが、1つの取っ掛かりにはなるかと思います。また、随時更新していくつもりです。

なお、作成にあたっては、筑波大学・李在鎬先生のサイト(コーパス日本語学の情報館)と、法政大学・尾谷昌則先生のサイトを参考にさせていただきました。この場をお借りして感謝申し上げます。