quarta-feira, 25 de junho de 2008

Fim da Teoria e o dilúvio de dados

Muito instigante o ensaio The end of Theory: the data deluge makes Scientific Methods Obsolete, de Chris Anderson, na Wired. Nele, Anderson faz elocubrações a partir da fala de Peter Norvig, diretor de pesquisa da Google, (e ídolo do Rodrigo) na O`Reilly Emerging Technology Conference em março deste ano.

Em suma: modelos científicos seriam aplicáveis em uma época em que hipóteses eram testáveis. Hoje, com um dilúvio de dados, como ele propõe, nem taxonomia, nem ontologia seriam úteis, porque sempre estariam errados.

Como exemplo, ele ilustra que o sistema revolucionário da Google se baseia em matemática aplicada e não em fantásticas teorias sobre propaganda, não em análise de conteúdo. E dá certo em qualquer lugar do mundo.

Não sei, o texto parece contraditório em alguns pontos ( ou eu não entendi direito). Ele diz que durante anos cientistas foram treinados para reconhecer que correlação não é causa, pois a relação entre X e Y poderia ser apenas coincidência.

Como ele diz: "Petabytes allow us to say: correlations is enough". Mas como achar correlação sem modelo, sem "reconhecimento de padrões"? Até mesmo o Cluster Exploratory, desenvolvido pela Google e pela IBM é programado para encontrar a enxurrada de dados de um certo modo. Isso não é um modelo?

Eu acho que modelos são necessários, embora limitados e devem ser adaptáveis a contextos que mudam. Eu também sei que a ciência não tem mais o mesmo alcance e a mesma aplicabilidade dos tempos newtonianos. Acho que em vez de ciência de massa, temos cada vez mais ciência de nicho, para parafrasear o Anderson. Mas daí a dizer que a Ciência é obsoleta, é muito arriscado. Só se para ele, "a Teoria" se refira a isso.