ホーム > タグ > Mecab
Mecab
WordPressのエントリをFF11用語辞典の単語でオートリンク対応させてみた
- 2009-02-09 (月)
- WordPress
某M氏の協力のもと、WordPressを改造しましたよ。
手動でリンクを貼っていたFF11の記事を不憫に思ったそうです^p^どうもありがとう。
というわけでFF11用語辞典 ~ ウィンダスの仲間たち版のキーワード一覧を自サーバ内に辞書として作成し、出力時に形態素解析して辞書にあればwikiにリンクを貼るって処理です。
例を挙げるとはてなダイアリーやwikipediaみたいなアレです。 たぶん。
用語辞典の更新が1日だいたい20-30ページもあるんですが、更新か新規かの区別が付かない。
ので、1週間ごとに勝手に辞書作成するようにしてみました。
アク禁食らわないくらいのアクセスにしなければ!
問題がなくはなくて、出力時に無条件でエントリに対して適用するため、FF11と関係のないエントリまで自動リンクに!
エントリ出力時にどうにかして区別する方法を見つけなければ。
テンプレート側なら簡単に条件分岐できると思うけど出来るなら下位層で何とかシタイヨネー。
というわけでNovu氏知ってたらおねがいします^p^
辞書ファイルはMecabとやらで作成したのはよいのですが、PHPとこの辞書をつなげるphp_mecabというのがいまいち使い勝手が悪い。 まだあまりソースコードも読んでないからアレなんですが。
純粋に文字列に対してリンク貼るっていうただそれだけのルールなんですよね。
だのでタグ中の文字列にも効いてしまう。 これはイカンかった。
あとはアンカータグとアンカータグの間もだめよね。
というわけでWordPressのコアファイルに手を入れて、文字列とタグを分けてやアンカータグが始まったら終わるまでその間はオートリンクさせないとかタグ中の文字列には効かなくさせるとか、そんな両者の仲介のような関数一個作りましたとさ。
- Comments: 2
- Trackbacks: 0
Home > Tags > Mecab
- Search
- Feeds
- Meta