数据仓库用hive还是hbase(HIVe是一种数据仓库)

返回192.168.0.1路由器设置

最后更新：2023-04-21 20:35:15 手机定位技术交流文章

有几点关于hadoop的hive数据仓库和hbase几点疑惑，希望有高手可以帮忙解决一下，谢谢了！！！

首先感觉你有点乱。。。你先明白数据仓库的作用－－存储历史数据－进而对数据进行分析，只提供查询－不提供修改1。Hive 的目标是做成数据仓库，所以它提供了SQL，提供了文件－表的映射关系，又由于Hive基于HDFS，所以不提供Update，因为HDFS本身就不支持。2.HBase 是NoSQL数据库－所以不要跟传统混淆并谈－NoSQL 提供的是另一种思路来满足高性能的需求，而这些是传统数据库的短板，与传统数据库的理念不一样3.load data 这个可以自己去查。Hbase要使用自己的API4.是的。5.这句话不对。6.映射就是结构对应－如文件每一行的第一个字段－映射到Hive表的第一个字段类似Hibernate的语法解析。 Hive本身实现了一套语法结构也就是操作符。如扫描文件等，最终记本都会转换成MapReduce来运行

徐州北大青鸟分享Hbase知识点总结？

hbase概念: 非结构化的分布式的面向列存储非关系型的开源的数据库，根据谷歌的三大论文之一的bigtable 高宽厚表作用: 为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。能干什么: 存储大量结果集数据，低延迟的随机查询。sql: 结构化查询语言 nosql: 非关系型数据库，列存储和文档存储(查询低延迟),hbase是nosql的一个种类，其特点是列式存储。非关系型数据库--列存储(hbase) 非关系型数据库--文档存储(MongoDB) 非关系型数据库--内存式存储(redis) 非关系型数据库--图形模型(graph) hive和hbase区别? Hive的定位是数据仓库，虽然也有增删改查，但其删改查对应的是整张表而不是单行数据，查询的延迟较高。其本质是更加方便的使用mr的威力来进行离线分析的一个数据分析工具。HBase的定位是hadoop的数据库，电脑培训http://www.kmbdqn.cn/发现是一个典型的Nosql，所以HBase是用来在大量数据中进行低延迟的随机查询的。hbase运行方式: standalonedistrubited 单节点和伪分布式? 单节点:单独的进程运行在同一台机器上 hbase应用场景: 存储海量数据低延迟查询数据 hbase表由多行组成 hbase行一行在hbase中由行健和一个或多个列的值组成，按行健字母顺序排序的存储。

hbase和hive的差别是什么，各自适用在什么场景中

1.Hive中的表是纯逻辑表，就只是表的定义等，即表的元数据。Hive本身不存储数据，它完全依赖HDFS和MapReduce。这样就可以将结构化的数据文件映射为为一张数据库表，并提供完整的SQL查询功能，并将SQL语句最终转换为MapReduce任务进行运行。而HBase表是物理表，适合存放非结构化的数据。 2.Hive是基于MapReduce来处理数据,而MapReduce处理数据是基于行的模式；HBase处理数据是基于列的而不是基于行的模式，适合海量数据的随机访问。3.HBase的表是疏松的存储的，因此用户可以给行定义各种不同的列；而Hive表是稠密型，即定义多少列，每一行有存储固定列数的数据。4.Hive使用Hadoop来分析处理数据，而Hadoop系统是批处理系统，因此不能保证处理的低迟延问题；而HBase是近实时系统，支持实时查询。5.Hive不提供row-level的更新，它适用于大量append-only数据集（如日志）的批任务处理。而基于HBase的查询，支持和row-level的更新。 6.Hive提供完整的SQL实现，通常被用来做一些基于历史数据的挖掘、分析。而HBase不适用与有join，多级索引，表关系复杂的应用场景。
hbase和hive的差别对比：1、hbase当前noSql数据库的一种，hive是hdfs分布式文件系统的一种，二者对数据的存储方式是不同的。2、使用场景：hbase最常见的应用场景就是采集的网页数据的存储，由于是key-value型数据库，可以再扩展到各种key-value应用场景，如日志信息的存储，对于内容信息不需要完全结构化出来的类CMS应用等。注意hbase针对的仍然是OLTP应用为主。hive主要针对的是OLAP应用，其底层是hdfs分布式文件系统，重点是基于一个统一的查询分析层，支撑OLAP应用中的各种关联，分组，聚合类SQL语句。hive一般只用于查询分析统计，而不能是常见的CUD操作，要知道HIVE是需要从已有的数据库或日志进行同步最终入到hdfs文件系统中，当前要做到增量实时同步都相当困难。

云南电脑培训学校告诉你Hbase知识点总结？

hbase概念:非结构化的分布式的面向列存储非关系型的开源的数据库，根据谷歌的三大论文之一的bigtable高宽厚表作用:为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。能干什么:存储大量结果集数据，低延迟的随机查询。sql:结构化查询语言nosql:非关系型数据库，列存储和文档存储(查询低延迟),hbase是nosql的一个种类，其特点是列式存储。非关系型数据库--列存储(hbase)非关系型数据库--文档存储(MongoDB)非关系型数据库--内存式存储(redis)非关系型数据库--图形模型(graph)hive和hbase区别?Hive的定位是数据仓库，虽然也有增删改查，但其删改查对应的是整张表而不是单行数据，查询的延迟较高。其本质是更加方便的使用mr的威力来进行离线分析的一个数据分析工具。HBase的定位是hadoop的数据库，电脑培训http://www.kmbdqn.cn/发现是一个典型的Nosql，所以HBase是用来在大量数据中进行低延迟的随机查询的。hbase运行方式:standalonedistrubited单节点和伪分布式?单节点:单独的进程运行在同一台机器上hbase应用场景:存储海量数据低延迟查询数据hbase表由多行组成hbase行一行在hbase中由行健和一个或多个列的值组成，按行健字母顺序排序的存储。

hive与hbase的十大区别与联系

1、Hive跟Hbase都是基于hadoop的hdfs文件系统，都是apache下的项目 2、Hive是基于hdfs的数据仓库，优势在于做大规模数据的离线分析，不属于分布式数据库3、Hbase则是分布式数据库，不是基于分布式文件系统，这是本质区别 4、hive跟hbase的数据可以互导

本文由在线网速测试整理编辑，转载请注明出处。