Analítica de Dados Com Hadoop: Uma Introdução Para Cientistas de Dados Código: 740277

  • Benjamin Bengfort
NOVATEC
FracoRegularBomÓtimoExcelente Sem avaliação
à vista no boleto bancário

Este produto será entregue por um de nossos parceiros

Produto Sob Encomenda: Este produto não está disponível para entrega imediata e será encomendado junto à editora. Previsão de postagem em até 5 dias úteis + tempo de transporte (conforme frete escolhido), após a confirmação do pagamento.
Avalie o produto:
Excelente

Características do Produto

Autor(es)
  • Benjamin Bengfort
ISBN9788575225219
Numero de Páginas352
Numero de Edição1
Ano de Edição2016
EditoraNOVATEC
Ano de Publicação2016
EncadernaçãoBrochura
OrigemNacional

Sinopse

Pronto para usar técnicas estatísticas e de aprendizado de máquina (machine learning) em grandes conjuntos de dados? Este guia prático mostra por que o ecossistema do Hadoop é perfeito para essa tarefa. Em vez de ter como foco a implantação, as opera ções ou o desenvolvimento de softwares geralmente associados à computação distribuída, você se concentrará nas análises particulares que poderá fazer, nas técnicas de armazém de dados (data warehousing) oferecidas pelo Hadoop e em fluxos de trabalho de alta ordem que esse framework é capaz de gerar. Os cientistas e os analistas de dados aprenderão a usar diversas técnicas que variam da escrita de aplicações MapReduce e Spark com Python ao uso de modelagem avançada e gerenciamento de dados com S park MLlib, Hive e HBase. Você também conhecerá os processos analíticos e os sistemas de dados disponíveis para desenvolver e conferir eficácia aos produtos de dados capazes de lidar com – e que, na verdade, exigem – quantidades enormes de dados. En tenda os conceitos principais do Hadoop e do processamento em cluster. Utilize padrões de projeto e algoritmos analíticos paralelos para criar jobs de análise de dados distribuídos. Adquira conhecimentos sobre gerenciamento de dados, mineração e arma zém de dados em um contexto distribuído usando Apache Hive e HBase. Utilize Sqoop e Apache Flume para entrada de dados a partir de bancos de dados relacionais. Programe aplicações Hadoop e Spark complexas com Apache Pig e Spark DataFrames . Utilize t écnicas de aprendizado de máquina, como classificação, clustering e filtragem colaborativa, com a MLib do Spark.
Minha Conta