Qual é o melhor livro de matemática que um aspirante a cientista de dados deve ler?

Provavelmente, não existe um único melhor livro de matemática para todos os cientistas de dados.

No entanto, os livros mais amplamente recomendados de uma perspectiva teórica / matemática são os seguintes:

Machine Learning: A Probabilistic Perspective (Computative Adaptive and Machine Learning series): Kevin P. Murphy: 9780262018029: Amazon.com: livros

Reconhecimento de Padrões e Aprendizado de Máquina (Ciência da Informação e Estatística): Christopher Bishop: 9780387310732: Amazon.com: Books

Amazon.com: The Elements of Statistical Learning: Data Mining, Inference and Prediction, Second Edition (Springer Series in Statistics) (9780387848570): Trevor Hastie, Robert Tibshirani, Robert Tibshirani e Jerome Friedman: livros

Probabilistic Graphical Models: Principles and Techniques (Adaptive Computation and Machine Learning series): Daphne Koller, Nir Friedman: 8601401113034: Amazon.com: livros

A leitura de qualquer um desses livros definitivamente lhe dará uma boa compreensão de várias técnicas matemáticas e estatísticas.

Eu realmente gostei da Max Kuhns Applied Predictive Modeling. É um ótimo livro com muitos exemplos e conjuntos de dados relevantes para explorar na R. Emparelhado com os elementos do aprendizado estatístico , você pode aprender um pouco.

More Interesting

Qual é a melhor opção para um graduado em CS com 2 anos de experiência em análise, um MS em analítica / ciência de dados (geralmente são programas de 1 ano) ou um MS em CS com especialização em ML (procurando universidades nos EUA)?

Qual é o escopo do big data nos EUA?

Como se tornar um cientista de dados

Quais cursos on-line de análise de dados são preferíveis? Eu trabalhei principalmente apenas no Excel até agora e quero obter alguma experiência com análises avançadas.

Em quais outros setores, como petróleo e gás, você vê a ciência de dados fazendo uma grande diferença?

Quais são algumas idéias sobre o uso do KNIME para análise e mineração de dados?

Qual algoritmo de aprendizado de máquina devo usar quando tiver de 5 a 6 valores categóricos independentes e 1 variável contínua dependente?

O que são idéias de projetos de big data no campo da neurociência?

Em que casos uma análise causal é mais apropriada para uma empresa ou departamento de pesquisa do que a modelagem preditiva?

Quais são as principais diferenças entre Inteligência Adaptativa e Aprendizado por Reforço?

Onde eu aprendo sobre servidores e big data?

Quais são os desafios no processamento de grandes quantidades de dados (2017)?

Quais empresas lideram a inovação e a tecnologia em aprendizado de máquina e ciência de dados?

Qual o nível das perguntas de codificação do algoritmo Python que você faria para uma entrevista sobre ciência de dados (nível interno)?

Quão bem a ciência de dados está sendo usada no Quora?