読者です 読者をやめる 読者になる 読者になる

HTMLのタグを除去して文字数だけをカウントしたい

Ruby

Rubyで例えばブログみたいなシステムを想定して「DBの中身はHTMLなんだけど、タグ部分は除いて純粋な本文の文字数のみをカウントしたい」ってとき。想像以上に簡単にできちゃうのでメモ。

Nokogiriを使えば以下のようにすればok。

Nokogiri::HTML(source).xpath("//text()").to_s.length

まとめ

Nokogiriありがとう :pray: