Rasti enhavon de TTT |
Unua Eldono : 2018-11-05 Lasta Ŝanĝo: |
Rasti enhavon de TTT (Web scraping) estas tekniko, ke ni gajnas mutaljn informojn en TTT paĝoj.
Nun ni elektu ŝlosilvorton. Ni havas ŝlosilvorton "esperanto". Ni gainas numeron de paĝo de "proksimume *** rezultoj".
# scraping.rb
require 'open-uri'
url = 'https://www.google.co.jp/search?q=esperanto'
page = open(url)
text = page.read
print text.scan(/proksimume .* rezultoj/)
Komando
ruby -Ku scraping.rb
["proksimume 89 800 000 rezultoj"]
Lernejo de Marinkjo > Lernejo de Rubeno > Rasti enhavon de TTT