PHP Twitter Bot :: Crawling Emails 4


Um dos projectos que estou a começar a desenvolver é um Twitter Bot que seja capaz de simular o comportamento de um utilizador durante um curto período de tempo, dependendo da configuração que o utilizador lhe quiser dar. Deve também ter todas as funcionalidades que possam ser úteis ou pensáveis para um programa deste género e por isso muito é necessário pesquisar e estudar.

Hoje surgiu-me a ideia de utilizar a pesquisa do Twitter para encontrar e-mails. Claro que não fui o primeiro a pensar nisto, então em vez de reinventar a roda fui alterá-la apenas para andar melhor.

O que este código faz, basicamente, é ler a página de pesquisa do Twitter e utilizando Regular Expressions encontrar os e-mails existentes na página, e depois continua pelas páginas seguintes.

/search?page=”.$id.”&q=gmail.com+OR+msn.com+OR+hotmail.com+OR+%22email+me%22&rpp=100

page numero da página
q representa a query, a chave a pesquisar
rpp results per page sendo que o máximo permitido pelo twitter é 100

Como podem reparar no meu código existe uma função que não está presente nem faz parte do PHP, a proxify_my_connection, é uma ferramenta que eu próprio desenvolvi há algum tempo e que não a quero tornar pública. Mas é fácil de a substituir, mesmo utilizando funções que já vêm de raíz no PHP. Podem também ver aqui uma função com efeito semelhante à que eu desenvolvi, no entanto não tem nada a ver uma com a outra.

Em vez da função writemail() é mais produtivo ter uma base de dados onde quardar os e-mails e verificar se estes são repetidos ou não…

Podem dar uso à vossa imaginação, aumentar e desenvolver a query, aumentar a performance do script, etc. isto foi só um pequeno exemplo do que se pode fazer com a search do twitter.

Bibliografia

Regex utilizado no meu código: http://www.fromzerotoseo.com/twitter-email-grabber/

Contribua para este blog deixando

a sua opinião e um pouco do seu conhecimento


Leave a Reply

4 thoughts on “PHP Twitter Bot :: Crawling Emails

  • guilherme

    sem querer loguei num site de twitter que fez eu seguir automaticamente pessoas que não conheço
    queria saber como fazer isso parar ;/

    • João Pedro Pereira Post author

      Viva Guilherme,

      existem dois métodos de terem tido acesso à sua conta e de o manterem, através dos seus dados (Nome de Utilizador e Password) ou através da funcionalidade OAuth do Twitter.

      No primeiro caso sugiro que altere a sua Password e o caso deve ficar resolvido.

      No segundo caso também é bastante simples, vá a http://twitter.com/account/connections e de seguida clique em Revoke Access no serviço do site que fez com que seguisse automaticamente outros utilizadores.

      Com uma das etapas referidas deve ficar resolvido o problema, caso contrário entre em contacto novamente.

      Cumprimentos,
      João Pedro Pereira

  • joao

    Boa iniciativa, podias era dar alguma informação a post’s anteriores de maneira a que facilita-se a utilização por exemplo no “template system kiss”

    Cumps