quarta-feira, 25 de junho de 2008

Fim da Teoria e o dilúvio de dados

Muito instigante o ensaio The end of Theory: the data deluge makes Scientific Methods Obsolete, de Chris Anderson, na Wired. Nele, Anderson faz elocubrações a partir da fala de Peter Norvig, diretor de pesquisa da Google, (e ídolo do Rodrigo) na O`Reilly Emerging Technology Conference em março deste ano.

Em suma: modelos científicos seriam aplicáveis em uma época em que hipóteses eram testáveis. Hoje, com um dilúvio de dados, como ele propõe, nem taxonomia, nem ontologia seriam úteis, porque sempre estariam errados.

Como exemplo, ele ilustra que o sistema revolucionário da Google se baseia em matemática aplicada e não em fantásticas teorias sobre propaganda, não em análise de conteúdo. E dá certo em qualquer lugar do mundo.

Não sei, o texto parece contraditório em alguns pontos ( ou eu não entendi direito). Ele diz que durante anos cientistas foram treinados para reconhecer que correlação não é causa, pois a relação entre X e Y poderia ser apenas coincidência.

Como ele diz: "Petabytes allow us to say: correlations is enough". Mas como achar correlação sem modelo, sem "reconhecimento de padrões"? Até mesmo o Cluster Exploratory, desenvolvido pela Google e pela IBM é programado para encontrar a enxurrada de dados de um certo modo. Isso não é um modelo?

Eu acho que modelos são necessários, embora limitados e devem ser adaptáveis a contextos que mudam. Eu também sei que a ciência não tem mais o mesmo alcance e a mesma aplicabilidade dos tempos newtonianos. Acho que em vez de ciência de massa, temos cada vez mais ciência de nicho, para parafrasear o Anderson. Mas daí a dizer que a Ciência é obsoleta, é muito arriscado. Só se para ele, "a Teoria" se refira a isso.

4 comentários:

Daiane disse...

Oi Sandra,

Acabei de ler o artigo e UAU - se o que ele propoe realmente se tornar mainstream, seria o fim da pesquisa qualitativa, interpretativa e etnografica. Quando ele afirma que a informacao na era petabyte "forces us to view data mathematically first and establish a context for it later" eu posso entender, porque o volume de informacoes com que trabalhamos atualmente eh imenso e nao podemos tentar entender cada elemento em profundidade. Mas nao acho que correlacionar fatos seja suficiente. Pode ser otimo para a fisica, biologia...Mas ainda nao consigo imaginar nossas ciencias sociais destituidas do contexto!

Tekhnè disse...

Eu penso exatamente como tu, Daiane. É claro que o que ele fala faz sentido em alguns campos, mas não pode ser generalizado. Mesmo para estabelecer correlação, em alguns contextos, é necessário interpretar. E não é problema nenhum a coisa toda ser limitada. Teoria que se preze é refutável mediante variáveis, senão não seria teoria. No fundo, eu acho que o Peter Norvig (Google), que é um baita pesquisador de Web Semântica (meu colega da Computação que disse), devem estar querendo desviar a atenção do mercado com esse papo. Ou pode ter sido a conclusão do Anderson tb. Só pode ser! Bjs,

daftm disse...

Olá Sandra!
Acabei de ver que, um dia antes de eu postar um artigo sobre este número da Wired, você colocou seu comentário aqui.
Depois dá uma olhada lá no meu blog iniciante.

Pedro HBr disse...

concordei contigo.
Sempre acho o anderson um pouco exagerado em suas colocações até pq o, dito, 'modelo' da google se baseia na mais antiga base para qualquer empresa científica: a matemática.

E até certo ponto perpetua exatamente um modelo de mundo (e científico) no qual se saí do subjetivismo e se entra numa lógica de que tudo é reserva de recurso calculável.