网学之家(5588net.com) - 执着关注互联网技术!

网学之家|5588net.com

当前位置: 主页 > 数据库 >
  • [hive教程] hive中分组取前N个值的实现 日期:2014-05-05 21:36:19 点击:99 好评:0

    背景 假设有一个学生各门课的成绩的表单,应用hive取出每科成绩前100名的学生成绩。 这个就是典型在分组取Top N的需求。 解决思路 对于取出每科成绩前100名的学生成绩,针对学生成绩...

  • [hive教程] hive 创建/删除/截断 表(翻译自Hive wiki) 日期:2014-05-05 21:36:19 点击:124 好评:0

    这里罗列常用操作,更多参考 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-Create%2FDrop%2FTruncateTable 简单的创建表 create table table_name ( id int, dtDontQuery string, name string...

  • [hive教程] Hive子查询(翻译自Hive wiki) 日期:2014-05-05 21:36:19 点击:143 好评:0

    子查询语法 SELECT ... FROM (subquery) name ... Hive只在FROM字句支持子查询。子查询必须给一个名字,因为每个表在FROM字句必须有一个名字。子查询的查询列表的列,必须有唯一的名字。子查询...

  • [hive教程] hive sql遇到的问题 日期:2014-05-05 21:36:18 点击:106 好评:0

    记录下工作中,使用hive sql遇到的问题,和大家共享。 某个字段条件过多,查询条件失效 select * from login where dt=20130101 and (ver !=3.1 or ver !=3.2 or ver != 4.0 or ver != 5.2); 备注:感谢 杨庆荣的指...

  • [hive教程] hive数据操作(翻译自Hive wiki+实例讲解) 日期:2014-05-05 21:36:18 点击:107 好评:0

    hive有两种数据修改方式 从文件加载到hive表 加载数据到表时,hive不会做任何转换。加载操作是纯粹的复制/移动操作,移动数据文件到相应的hive表。 语法 LOAD DATA [LOCAL] INPATH filepath [O...

  • [hive教程] hive实例讲解实现in和not in子句 日期:2014-05-05 21:36:18 点击:100 好评:0

    目前hive不支持 in或not in 中包含查询子句的语法,所以只能通过left join实现。 假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户,字段只有一个...

  • [hive教程] hive原生和复合类型的数据加载和使用 日期:2014-05-05 21:36:17 点击:86 好评:0

    原生类型 原生类型包括TINYINT,SMALLINT,INT,BIGINT,BOOLEAN,FLOAT,DOUBLE,STRING,BINARY (Hive 0.8.0以上才可用),TIMESTAMP (Hive 0.8.0以上才可用),这些数据加载很容易,只要设置好列分隔符,按照列分隔符输...

  • [hive教程] Hive Explain(翻译自Hive wiki) 日期:2014-05-05 21:36:17 点击:100 好评:0

    EXPLAIN语法 Hive提供EXPLAIN命令,显示查询的执行计划。语法如下: EXPLAIN [EXTENDED] query EXPLAIN语句使用EXTENDED,提供执行计划关于操作的额外的信息。这是典型的物理信息,如文件名。 Hi...

  • [hive教程] Hive虚拟列(翻译自Hive wiki) 日期:2014-05-05 21:36:16 点击:104 好评:0

    虚拟列 Hive 0.8.0支持两个虚拟列: INPUT__FILE__NAME, mapper任务的输出文件名。 BLOCK__OFFSET__INSIDE__FILE, 当前全局文件的偏移量。对于块压缩文件,就是当前块的文件偏移量,即当前块的第一个...

  • [hive教程] hive大数据倾斜总结 日期:2014-05-05 21:36:16 点击:97 好评:0

    在做Shuffle阶段的优化过程中,遇到了数据倾斜的问题,造成了对一些情况下优化效果不明显。主要是因为在Job完成后的所得到的Counters是整个Job的总和,优化是基于这些Counters得出的平...

  • 首页
  • 上一页
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 下一页
  • 末页
  • 54540
栏目列表
推荐内容