Rasti enhavon de TTT

Unua Eldono : 2018-11-05
Lasta Ŝanĝo:

Rasti enhavon de TTT

Rasti enhavon de TTT (Web scraping) estas tekniko, ke ni gajnas mutaljn informojn en TTT paĝoj.

Kommandoj

ĉapitro 1 : fiksa ŝlosilvorto

Nun ni elektu ŝlosilvorton. Ni havas ŝlosilvorton "esperanto". Ni gainas numeron de paĝo de "proksimume *** rezultoj".


# scraping.rb 
require 'open-uri'

url = 'https://www.google.co.jp/search?q=esperanto'
page = open(url)
text = page.read
print text.scan(/proksimume .* rezultoj/) 

Komando
ruby -Ku scraping.rb

["proksimume 89 800 000 rezultoj"]

Lernejo de MarinkjoLernejo de Rubeno > Rasti enhavon de TTT


MARUYAMA Satosi