Taggingについてうだうだ。

※以下は「私の」方針のメモであって、他者に推奨する意図は一切ない。私はSBMというよりPersonal BookMarkとして使っている。


検索に使うことが無いようなタグはつけないこと。コメントしたいだけのときはタグはつけない。また、検索では使わないような種類のタグ(タグというよりレッテルと呼ぶべきもの)はつけない。例えば、それがブログの記事であるからといってblogタグはつけない。blogタグは(MovableBlogのような)ブログシステムやblog絡みのテクノロジーにつける。また、ブログ界隈の話題についてはblogタグではなくblogosphearを用いる。(ただしblogosphearで再検索するようなものは少ないので、このタグはあまり用いられない。)

一度しか使わないようなタグはつけないこと。そういうものは記事タイトルやコメント本文の検索で足る。例えば佐藤寿人ダルビッシュというタグはつけても松坂タグはつけない。他方、将来的に再利用されそうなら積極的につける。(もっとも、閾値で「殆ど使われないタグ」は除外できるので、あまり考えすぎる必要はないかもしれない。)

命名規則は工夫した方が良いかも。大文字と小文字は区別する。そのほうが見易い。日本語と英語をどうするかも考え所だ。日本語の方が探しやすいかと思ったら、そうでもない。文であれば漢字仮名交じりのメリットがあるが、単語では等幅の日本語よりむしろ文字幅が違う英語の方が見易いようだ。また、記事の使用言語で区別する方針は採用しない。さしあたり英語の固有名詞は英語、一般名詞は日本語といったところか。Printerではなくプリンタだが、Wordはワードにはしない。こう考えると上述のblogosphearはブログ界とするべきかもしれない。略語の扱いも方針を統一したいかもしれない。今のところMicrosoftはMSではなくMicrosoft。他方、LightweightLanguageはLLで登録してある。LLは一般名詞なのでP言語のように日本語でも良いかもしれない(等価ではないが)。同義語の扱いも難しい。Ruby on RailsRoRとかRailsとか略すことが出来るが、これを両方つけてしまうと、ある記事ではRoR、ある記事はRailsと分散してしまって探しにくくなる。とりあえずRailsの方がカワイイ。

似て非なるものは区別する。例えばApple,Mac,OSXはそれぞれ区別している。重複させる場合も多いが、単独でつける場合も多い。AppleApple社絡み, Macは主にハード, OSXはOSについて。タグのグルーピングを使えば、楽天の記事にいちいち野球タグをつける必要はない。