About 30,100 results
Open links in new tab
  1. HBase 和 Hive 的差别是什么,各自适用在什么场景中? - 知乎

    1. Hive中的表是纯逻辑表,就只是表的定义等,即表的元数据。 Hive本身不存储数据,它完全依赖HDFS和MapReduce。 这样就可以将结构化的数据文件映射为为一张数据库表,并提供完整 …

  2. 请问spark和hive是什么关系? - 知乎

    再来看看hive。 hive 官网有描述,“Apache Hive data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL.”,hive的定位 …

  3. Hive学习笔记 - 知乎

    1 Hive概述 1.1 什么是Hive Apache Hive是一款建立在Hadoop之上的开源数据仓库系统,可以将存储在Hadoop文件中的结构化、半结构化数据文件映射为一张数据库表,基于表提供了一种…

  4. 有哪些类似于 Hive 的国产数据系统? - 知乎

    类似于Hive的国产数据系统主要是一些分布式数据库和数据仓库解决方案,它们提供了类似Hive的数据处理和分析能力。 TiDB是一款由PingCAP公司开发的开源分布式NewSQL数据库,它结 …

  5. 大数据之hadoop / hive / hbase 的区别是什么?有什么应用场景?

    2. Hive Hive是一个基于Hadoop的数据仓库系统,它将SQL语言转化为MapReduce任务,并在Hadoop集群上运行。 它提供了类似于SQL的查询和分析接口,使得非专业开发人员可以通过 …

  6. 如何通俗地理解Hive的工作原理? - 知乎

    接下去Hive会对执行计划进行优化,最常见的优化可能是PartitionPrune,比如你在Hive中定义了分区表,那么如果有Where条件中出现了分区字段,比如WHERE date = '2016-08-25',而且分 …

  7. hive 如何优化查询速度? - 知乎

    Hive 优化查询速度的方法有很多,你可以记下: 使用分区表和分桶表: 合理的分区和分桶可以大大减少查询数据量,提高查询效率。 避免使用 select *: 尽量只选择需要的列,避免查询不必 …

  8. Hive 零基础从入门到实战有哪些内容? - 知乎

    ③ Hive 的执行延迟比较高,因此 Hive 常用于数据分析,对实时性要求不高的场合。 ④ Hive 优势在于处理大数据,对于处理小数据没有优势,因为 Hive 的执行延迟比较高。 ⑤ Hive 支持用 …

  9. 一条Hive SQL作业执行慢,该怎么办? - 知乎

    最近笔者在某客户线上生产环境就频繁多次遇到了该问题,某些HIVE SQL 作业(底层非HIVE ACID事务表),因为迟迟获取不到HIVE锁导致作业长时间卡死,最后运维人员不得不登 …

  10. 没去过大公司如何学hive? - 知乎

    hive的元数据存储在关系数据库里,支持derby、mysql两种关系型数据库。 元数据对于hive十分重要,因此Hive支持把metastore服务独立出来,安装到远程的服务器集群里,从而解耦hive服 …