1)hive和关系型数据库存储⽂件的系统不同。 hive使⽤hdfs(hadoop的分布式⽂件系统),关系型数据库则是服务器本地的⽂件系统;
2)hive使⽤的计算模型是mapreduce,⽽关系型数据库则是⾃⼰设计的计算模型。
3)hive是为海量数据做数据挖掘设计的,实时性差;⽽关系型数据库是为实时查询的业务进⾏设计的。
4)hive很容易扩展⾃⼰的存储能⼒和计算能⼒,这个是继承hadoop的,⽽关系型数据库在这⽅⾯相对较差。⽽数据库由于 acid 语义的严格限制,扩展⾏⾮常有限。
5)hive中不⽀持对某个具体⾏的操作,对数据的操作只⽀持覆盖原数据和追加数据;hive也不⽀持事务和索引。 ---------已经都⽀持了吧
6)hive在加载数据时候和关系数据库不同。
hive:检查数据格式的操作是在查询操作时候执⾏,这种模式叫“读时模式"
关系数据库:“写时模式”,数据加载时候对数据模式进⾏检查校验的操作。
记住我 当我们的数据是⾮结构化,存储模式也是未知时候,关系数据操作这种场景就⿇烦多了,这时候hive就会发挥它的优势。
7)执⾏延迟。
在利⽤ mapreduce 执⾏ hive 查询时,也会有较⾼的延迟。相对的,数据库的执⾏延迟较低。
发布评论