计算机
23 篇文章
computer
力扣SQL题训练(二)
511. 游戏玩法分析 I 活动表 Activity:表的主键是 (player_id, event_date)。这张表展示了一些游戏玩家在游戏平台上的行为活动。每行数据记录了一名玩家在退出平台之前,…
Spark多种方法实现二次排序
def udfSortTest(args: Array[String]): Unit = { class UDFSort(val first: Int, val second: Int) extend…
力扣SQL题训练(一)
175. 组合两个表 表1: Person +-------------+---------+ | 列名 | 类型 | +-------------+---------+ | PersonId | i…
有用的算法-阿拉伯数字转中文读法代码
【有用的算法】 1、阿拉伯数字转中文读法代码 Tips:仅整数,万万亿往上有bug;提供Java、Objective-C版本代码 测试数据: 110000:一十一万 100000200:一亿零二百 1…
JVM架构及GC垃圾回收机制及相应的参数调优
一、Java内存区域概览   JVM实现(前两者已被Oracle收购):HotSpot、JRockit(BEA)、J9(IBM)、AJDK(阿里)等。JVM运行在操作系统之上,与硬件没有直接交互。  …
树的应用基础-LeetCode题
本文总结了我在LeetCode力扣中文网站上的做题经历,源代码及备忘录。 刷LeetCode力扣题推荐博客: labuladong 的算法小抄 小浩算法 小浩算法GitHub leetcode 100…
Pentaho Kettle 9.0.0.1 及34种ETL子系统基本概念(二)
1、ETL入门 四种数据处理方式:传统ETL工具(Kettle)、MapReduce、Hive、Spark。 数据整合方式:ETL、ELT、EII、ETLT(既可以由转换引擎执行转换也可以由数据库执行…
算法学习笔记
1、刷题懵逼的时候   1)暴力能否解决?查看输入输出基本情况?五步刷题法、四步做题。   2)找最近重复子问题(递推)。   3)数学归纳法。 2、琐碎   暴力法、自顶向下、自底向上、(头尾)双指…
内存排序算法
1、快速和归并   快速排序与归并排序看起来是相逆(步骤相反)的:partition、merge,归并先排序左右子数组后合并,快排先调配出左右子数组再对子数组排序。 快速排序 // 快速排序 publ…
Pentaho Kettle 9.0.0.1 源码编译及探索(一)
      Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle是一款国外开源的…
大数据操作笔记
TCP/IP 1、IP地址10开头和172开头和192开头的区别/判断是否同一网段 A、B、C三类IP地址的特征:当将IP地址写成二进制形式时, A类地址的第一位总是O,如,10.0.0.1==000…
Cloudera Manager操作笔记
一、集群的分布情况 测试集群:3台,5台,或者10台 机器配置: 内存:24g 、32g以上 硬盘:4T 或者说更高 cpu:10核,或者6核 网卡:万兆左右 生产集群: 小型集群: 20台以下 中型…
Kafka入门笔记
SparkSQL优化 所有spark应用都需要注意cpucores(给executor分配)和task数量之间的关系,默认情况下一个task的运行需要一个core SparkSQL的专门的优化 -a …
Spark入门笔记
Spark 基于内存的分布式计算框架 类似于MapReduce的 官网:http://spark.apache.org/ 官方博客:https://databricks.com/blog 上课所用的s…