网学之家(5588net.com) - 执着关注互联网技术!

网学之家|5588net.com

当前位置: 主页 > 数据库 >
  • [hive教程] hive 锁定(翻译自Hive wiki) 日期:2014-05-05 21:36:15 点击:121 好评:0

    Hive 并发模型 使用案例 并发支持 (http://issues.apache.org/jira/browse/HIVE-1293) 是数据库的必须,而且他们的使用案例很好懂。至少,我们要尽可能支持并发读和写。添加几个发现当前已经锁定的...

  • [hive教程] hive join详解 日期:2014-05-05 21:36:15 点击:98 好评:0

    Common Join 最为普通的join策略,不受数据量的大小影响,也可以叫做reduce side join ,最没效率的一种join 方式. 它由一个mapreduce job 完成. 首先将大表和小表分别进行map 操作, 在map shuffle 的阶...

  • [hive教程] hive修改 表/分区语句 日期:2014-05-05 21:36:15 点击:103 好评:0

    参考 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-AlterTable%2FPartitionStatements 这里主要列一些常用操作。 添加分区 ALTER TABLE table_name ADD PARTITION (partCol = value1) location...

  • [hive教程] hive文件存储格式 日期:2014-05-05 21:36:14 点击:125 好评:0

    hive文件存储格式包括以下几类: TEXTFILE SEQUENCEFILE RCFILE 自定义格式 其中TEXTFILE为默认格式,建表时不指定默认为这个格式,导入数据时会直接把数据文件拷贝到hdfs上不进行处理。 Seq...

  • [hive教程] hive GroupBy操作(翻译自Hive wiki) 日期:2014-05-05 21:36:13 点击:114 好评:0

    Group By 语法 groupByClause: GROUP BY groupByExpression (, groupByExpression)* groupByExpression: expression groupByQuery: SELECT expression (, expression)* FROM src groupByClause? 简单例子 为了计算表的行数: SELECT COUNT(*) FR...

  • [hive教程] hive函数(Hive wiki) 日期:2014-05-05 21:36:13 点击:251 好评:0

    Hive Operators and User-Defined Functions (UDFs) Hive Operators and User-Defined Functions (UDFs) Built-in Operators Relational Operators Arithmetic Operators Logical Operators Complex Type Constructors Operators on Complex Types Built-in F...

  • [hive教程] hive udf开发流程(Hive wiki) 日期:2014-05-05 21:36:12 点击:135 好评:0

    Creating Custom UDFs First, you need to create a new class that extends UDF, with one or more methods named evaluate. package com.example.hive.udf; import org.apache.hadoop.hive.ql.exec.UDF; import org.apache.hadoop.io.Text; public final cl...

  • [hive教程] hive 中 Order by, Sort by ,Dristribute by,Cluster By 的作用 日期:2014-05-05 21:36:12 点击:128 好评:0

    order by order by 会对输入做全局排序,因此只有一个reducer(多个reducer无法保证全局有序) 只有一个reducer,会导致当输入规模较大时,需要较长的计算时间。 set hive.mapred.mode=nonstrict; (d...

  • [hive教程] hive的hive.exec.parallel参数说明 日期:2014-05-05 21:36:11 点击:108 好评:0

    hive.exec.parallel参数控制在同一个sql中的不同的job是否可以同时运行,默认为false. 下面是对于该参数的测试过程: 测试sql: select r1.a from ( select t.a from sunwg_10 t join sunwg_10000000 s on t.a=s.b) r1 j...

  • [hive教程] hive local hadoop特性 日期:2014-05-05 21:36:10 点击:131 好评:0

    在hive0.7的版本中增加了local hadoop的功能,就是在处理数据量比较小的情况在本地执行,而不走分布的mapred。 这样一来,那些比较小的任务的执行速度就会大大提高。 那到底什么样的任...

  • 首页
  • 上一页
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 下一页
  • 末页
  • 54540
栏目列表
推荐内容