Lädt...


🔧 Mais dados é melhor que um algoritmo mais eficiente


Nachrichtenbereich: 🔧 Programmierung
🔗 Quelle: dev.to

Recentemente li um texto de blog do Anand Rajaraman no qual ele descreve uma atividade que ele passou para seus alunos na Universidade de Stanford na qual eles deveriam realizar qualquer tarefa de data mining não trivial, onde a maioria decidiu tentar resolver o “Netflix Chalenge”, um desafio no qual o candidato deve fazer um algoritmo de recomendação de filmes melhor que o da plataforma.

O desafio consiste em usar um dataset enviado pela empresa onde várias pessoas deram notas para filmes e o desafio é predizer a nota de filmes sem notas dadas. Um clássico problema de receber um dataset de treino, treinar um modelo com esses dados e testar esse mesmo modelo em um dataset de teste. Se você conseguir uma acurácia superior à do algoritmo da netflix respeitando uma determinada margem você leva para casa um prêmio de 1 milhão de dólares.

Continuando na descrição de sua experiência em sua aula, Rajaraman comenta que vários alunos experimentaram diversas abordagens. Entre elas, podemos destacar duas: um time A experimentou um algoritmo extremamente elaborado para resolver o problema e um time B fundiu o dataset da Netflix com dados fornecidos pelo IMBD (Internet Movie Data Base).

Resumindo a história, o time B conseguiu melhores resultados e quase alcançou a acurácia da Netflix, mesmo com um algoritmo mais simples que o do time A, que não foi muito longe.

Minha experiência no Curso de Ciência da Computação

Em uma disciplina chamada “Informática e Sociedade”, na UFPA, tínhamos aulas muito mais próximas da filosofia, onde éramos convidados a debater sobre diversos assuntos referentes aos impactos da computação na sociedade. Acredito que foi uma boa experiência para mim.

Nessa disciplina, uma das aulas era sobre dados e o professor trouxe uma provocação: “Dados são realmente o novo petróleo?”. Eu não tenho certeza absoluta se essa foi a fonte que ele nos passou para discutirmos em aula, mas eu creio que era. Segue o link:

Is Data Really The New Oil?

Lembro que eu fui o mais engajado naquela aula, até mesmo por sempre ser entusiasmado com dados. Eu realmente discordava com o ponto do professor. Para ele, na verdade, o novo petróleo eram os algoritmos que tratavam esses dados e não os dados em sim.

Entretanto, para mim a analogia sempre foi bem clara: dados são a matéria prima, sem ele nada é feito. Além disso, assim como petróleo é inútil sem o processamento que ele passa, dados não servem para nada se estiverem espalhados e sujos, se não são processados e se não agregamos valor para o mesmo através de processos industriais.

O artigo do Anand Rajaraman me lembrou essa discussão novamente, me fazendo acreditar ainda mais que mais dados no fim resolvem problemas melhor que algoritmos extremamente elaborados.

Claro que isso não é um incentivo a deixar de estudar algoritmos, afinal de contas, tendo uma mesma quantidade X de dados, um algoritmo melhor vai fazer um trabalho melhor.

Conclusão

Esse foi um tema que passou pela minha cabeça nos últimos dias e me deixou curioso para ouvir a opinião de outras pessoas. Peço desculpas se cometi algum erro ao comentar sobre petróleo, estou longe de ser um especialista no assunto, diferente do querido Sérgio Sacani do Space Today.

Ademais, espero que tenham gostado da leitura. Críticas, sugestões e correções são muito bem vindas na sessão de comentários abaixo. Vejo vocês no meu próximo artigo.

...

🔧 Mais dados é melhor que um algoritmo mais eficiente


📈 151.12 Punkte
🔧 Programmierung

🔧 O que é o Virtual DOM e por que ele torna o React tão eficiente?


📈 55.16 Punkte
🔧 Programmierung

🔧 ** El correcaminos: el algoritmo eficiente **🦊


📈 55.03 Punkte
🔧 Programmierung

🔧 Regra 1: O mais simples possível, mas não mais simples do que isso


📈 51.38 Punkte
🔧 Programmierung

🔧 Mais do que armazenamento de código: 5 features do GitHub que você não conhece


📈 47.5 Punkte
🔧 Programmierung

🔧 Um bom algoritmo e sua importancia para um código mais ágil


📈 47.36 Punkte
🔧 Programmierung

🔧 Simplificando a Codificação HTML: Atalhos para uma Criação Mais Eficiente


📈 44.5 Punkte
🔧 Programmierung

📰 Acceso Remoto Seguro: Por que es importante y por que hay que hacerlo bien


📈 43.62 Punkte
📰 IT Security Nachrichten

🔧 Reactjs, o 80/20 do seu melhor e mais performático código


📈 43.03 Punkte
🔧 Programmierung

🔧 Quando um framework é melhor que a manipulação nativa do DOM


📈 39.15 Punkte
🔧 Programmierung

🔧 Testes Finais Capítulo 5: Mais tipos de dados e operadores


📈 38.52 Punkte
🔧 Programmierung

🔧 Destrancando o Docker: Garantindo que seu aplicativo espere pelo banco de dados com Dockerize


📈 34.65 Punkte
🔧 Programmierung

🔧 Estrutura de Dados: O que é uma pilha?


📈 34.65 Punkte
🔧 Programmierung

🔧 Aprenda de uma vez o que é Banco de Dados e SGBD


📈 34.65 Punkte
🔧 Programmierung

🔧 Mulheres no Mercado de Trabalho : Dados e Reflexões. O que podemos aprender no filme "Barbie".


📈 34.65 Punkte
🔧 Programmierung

🔧 Os símbolos que mais aparecem nos sonhos


📈 32.96 Punkte
🔧 Programmierung

🔧 Operadores numéricos são mais complexos do que parece


📈 32.96 Punkte
🔧 Programmierung

🔧 Mais 5 atalhos do VS Code que você precisa conhecer


📈 32.96 Punkte
🔧 Programmierung

🐧 Mais fácil que o Linux Mint? - Zorin OS 15 - Review


📈 32.96 Punkte
🐧 Linux Tipps

🐧 SERÁ QUE CONSEGUIMOS MAIS 8 ANOS DE DIOLINUX?


📈 32.96 Punkte
🐧 Linux Tipps

⚠️ Avast - Instale agora e vá fazer o que você mais gosta sem preocupações


📈 32.96 Punkte
⚠️ Malware / Trojaner / Viren

⚠️ Avast - Instale agora e vá fazer o que você mais gosta sem preocupações


📈 32.96 Punkte
⚠️ Malware / Trojaner / Viren

🔧 Luz que me ilumina o caminho e que me ensina a viver...


📈 29.08 Punkte
🔧 Programmierung

📰 Tres cosas que los CIO pueden hacer para que la IA genere sostenibilidad


📈 29.08 Punkte
📰 IT Security Nachrichten

🔧 O que são microserviços? Para que servem e quando usar?


📈 29.08 Punkte
🔧 Programmierung

🔧 O Que é Design de Código e Por Que Isso Importa


📈 29.08 Punkte
🔧 Programmierung

🔧 O que é uma Memória RAM ECC? Para que serve e quando usar?


📈 29.08 Punkte
🔧 Programmierung

🔧 GitHub Discussion: O que é isso e pra que serve?


📈 29.08 Punkte
🔧 Programmierung

🔧 HTML Semântico: O que, por quê e como


📈 29.08 Punkte
🔧 Programmierung

🔧 HTML Semântico: O que, por quê e como


📈 29.08 Punkte
🔧 Programmierung

🔧 O que é Design system e por que usar


📈 29.08 Punkte
🔧 Programmierung

matomo