Cara Scrapping Data Tweet dari Twitter dengan Twint

Scrapping dengan Twint

  1. Twint

Twint adalah library yang disediakan python untuk melakukan scraping data twitter tanpa menggunakan API.


  1. Install Twint

Untuk menginstall library python dapat dengan mengetikkan perintah dibawah ini dengan terminal 

pip install twint


  1. Program untuk Scraping dengan Twint

Setelah instalasi berhasil untuk menggunakan library twint diperlukan untuk mengimport library Twint dengan perintah :


import twint


Contoh jika kita akan membuat program untuk scraping data twitter dengan kata kunci "vaksin", maka programnya adalah sebagai berikut


import twint


twi = twint.Config()

twi.Search = 'vaksin'

twint.run.Search(twi)


Jika ingin mengambil data twitter dengan kata kunci "vaksin" dari tanggal 1 januari 2021 sampa 1 Februari 2021, maka programnya adalah sebagai berikut


import twint


twi = twint.Config()

twi.Search = 'vaksin corona'

twi.Until = '2021-01-01'

twi.Since = '2021-02-01'

twint.run.Search(twi)


Jika ingin mengambil data twitter dengan kata kunci “vaksin” dari tanggal 1 januari 2021 sampai 1 Februari 2021 dengan custom data yang diambil berupa id, date, username, maka programnya adalah sebagai berikut


import twint


twi = twint.Config()

twi.Search = 'vaksin corona'

twi.Until = '2021-01-01'

twi.Since = '2021-02-01'

twi.Custom["tweet"] = ["id", "date", "username", "tweet"]

twint.run.Search(twi)


Jika ingin mengambil data twitter dengan kata kunci “vaksin” dari tanggal 1 januari 2021 sampai 1 Februari 2021 dengan custom data yang diambil berupa id, date, username, dan tweet kemudian hasil scaping akan disimpan dalam file csv, maka programnya adalah sebagai berikut


import twint

twi = twint.Config()

twi.Search = 'vaksin corona'

twi.Until = '2021-01-01'

twi.Since = '2021-02-01'

twi.Custom["tweet"] = ["id", "date", "username", "tweet"]

twi.Output = "vaksin.csv"

twi.Store_csv = True

twint.run.Search(twi)


Komentar