当前分类:/计算机专业/大数据相关

一、mapreduce入门 1、什么是mapreduce 首先让我们来重温一下 hadoop 的四大组件: HDFS:分布式存储系统 MapReduce:分布式计算系统 YARN: hadoop 的资源调度系统 Common: 以上三大组件的底层支撑组件,主要提供基础工具包和 RPC 框架等 Mapreduce 是一个分布式运算程序的编...

mapreduce 大数据 hadoop
方凯     2019-10-16 15:26     來源: 大数据相关     0 124 0

1相关术语 4 A Account,Authorization,Authentication,Audit 帐号、授权、认证、审计 BOSS Business & Operation Support System 业务 运营支撑系统 CRM Customer Relationship Management 客户 关系管理 DMZ ...

大数据 Hadoop
方凯     2019-07-24 16:31     來源: 大数据相关     0 203 0

第一章引论 1、 什么是数据挖掘? 数据挖掘更正确的命名为“从数据中挖掘知识”,是数据中的知识发现( KDD )的同义词。数据挖掘是从大量数据中挖掘有趣模式和知识的过程,数据源包括数据库、数据仓库、 web 、其他信息存储库或动态的流入系统的数据。 2、 知识发现的过程是什么? 知识发现的过程为: ( 1 )数据清理(消除噪声和删除不一...

大数据 数据挖掘
方凯     2019-07-24 15:19     來源: 大数据相关     0 135 0

Hadoop集群搭建教程(详细) 开始搭建hadoop集群 一.使用VMvare创建两个虚拟机,我使用的是ubuntu16.04版本的,并关闭全部虚拟机的防火墙 1.因为默认的虚拟机主机名都是ubuntu,所以为了便于虚拟机的识别,创建完成虚拟机后我们对虚拟机名进行修改,我们把用于主节点的虚拟机名称设为master(按自己的喜好创建),...

hadoop hadoop集群 集群搭建 大数据
方凯     2019-05-27 14:41     來源: 大数据相关     0 109 0

搭建Hadoop全分布式集群 前言   上一篇介绍了伪分布式集群的搭建,其实在我们的生产环境中我们肯定不是使用只有一台服务器的伪分布式集群当中的。接下来我将给大家分享一下全分布式集群的搭建!   其实搭建最基本的全分布式集群和伪分布式集群基本没有什么区别,只有很小的区别。 一、搭建Hadoop全分布式集群前提 1.1、网络   1)如果...

hadoop集群
方凯     2019-05-27 14:40     來源: 大数据相关     0 136 0

Kibana:分析及可视化日志文件 Kibana是一个针对Elasticsearch的开源分析及可视化平台,用来搜索、查看交互存储在Elasticsearch索引中的数据。使用Kibana,可以通过各种图表进行高级数据分析及展示。 Kibana让海量数据更容易理解。它操作简单,基于浏览器的用户界面可以快速创建仪表板(dashboard)...

kibana elasticsearch
方凯     2019-01-25 10:40     來源: 大数据相关     0 136 0

如何利用大数据? 2013年07月16日 06:25 AM 英国《金融时报》专栏作家蒂姆•哈福德 IBM称,全球所有计算机每天产生250亿亿个字节的数据。这相当于每人每天产生大约半张CD的数据量。无数激动人心的会议展示和咨询报告都以‚大数据‛为主题。那么,它对经济学可能有何帮助? 每个人所说的‚大数据‛含义不尽相同,但以下为一些共识。第...

大数据 数据挖掘
方凯     2018-07-10 10:10     來源: 大数据相关     0 152 0

1.1. 简介 ElasticSearch是一个基于Lucene构建的开源,分布式,RESTful搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。支持通过HTTP使用JSON进行数据索引。 我们建立一个网站或应用程序,并要添加搜索功能,令我们受打击的是:搜索工作是很难的。我们希望我们的搜索解决方案要快,我们...

Elasticsearch
方凯     2018-07-10 10:10     來源: 大数据相关     0 188 0

Elasticsearch基础教程 基础概念 Elasticsearch有几个核心概念。从一开始理解这些概念会对整个学习过程有莫大的帮助。 接近实时(NRT) Elasticsearch是一个接近实时的搜索平台。这意味着,从索引一个文档直到这个文档能够被搜索到有一个轻微的延迟(通常是1秒)。 集群(cluster) 一个集群就是由一个或...

elasticsearch
方凯     2018-07-10 10:10     來源: 大数据相关     0 132 0
分类名称 大数据相关
分类类型 知识
分类阅读权限 所有人
分类编辑权限 所有人
分类审核权限 无需审核
分类预览权限 所有人
分类下载权限 所有人
WCP知识管理系统-Vfree.4.2.0/419