HTMLのタグを除去して文字数だけをカウントしたい
Rubyで例えばブログみたいなシステムを想定して「DBの中身はHTMLなんだけど、タグ部分は除いて純粋な本文の文字数のみをカウントしたい」ってとき。想像以上に簡単にできちゃうのでメモ。
Nokogiriを使えば以下のようにすればok。
Nokogiri::HTML(source).xpath("//text()").to_s.length
まとめ
Nokogiriありがとう :pray:
Rubyで例えばブログみたいなシステムを想定して「DBの中身はHTMLなんだけど、タグ部分は除いて純粋な本文の文字数のみをカウントしたい」ってとき。想像以上に簡単にできちゃうのでメモ。
Nokogiriを使えば以下のようにすればok。
Nokogiri::HTML(source).xpath("//text()").to_s.length
Nokogiriありがとう :pray: