分布式计算 - CodingNote.cc

分布式机器学习：模型平均MA与弹性平均EASGD（PySpark）

2022 年 6 月 30 日
笔记

计算机科学一大定律：许多看似过时的东西可能过一段时间又会以新的形式再次回归。 1 模型平均方法(MA) 1.1 算法描述 …

分布式机器学习：同步并行SGD算法的实现与复杂度分析（PySpark）

2022 年 6 月 26 日
笔记

1 分布式机器学习概述大规模机器学习训练常面临计算量大、训练数据大（单机存不下）、模型规模大的问题，对此分布式机器学习 …

Spark: 单词计数(Word Count)的MapReduce实现(Java/Python)

2022 年 5 月 26 日
笔记

1 导引我们在博客《Hadoop: 单词计数(Word Count)的MapReduce实现》中学习了如何用Hado …

Hadoop: 单词计数(Word Count)的MapReduce实现

2022 年 5 月 24 日
笔记

1.Map与Reduce过程 1.1 Map过程首先，Hadoop会把输入数据划分成等长的输入分片(input spl …

Hive on Spark和Spark sql on Hive，你能分的清楚么

2022 年 1 月 4 日
笔记

摘要：结构上Hive On Spark和SparkSQL都是一个翻译层，把一个SQL翻译成分布式可执行的Spark程序。 …

并行Louvain社区检测算法

2021 年 12 月 12 日
笔记

因为在我最近的科研中需要用到分布式的社区检测（也称为图聚类（graph clustering））算法，专门去查找了相关文 …

分布式机器学习中的模型架构

2021 年 12 月 5 日
笔记

在上一篇博文《分布式机器学习中的模型聚合》(链接：//www.cnblogs.com/orion-orion/p/156 …

分布式机器学习中的模型聚合

2021 年 12 月 2 日
笔记

论文1在联邦（分布式）学习的情景下引入了多任务学习，其采用的手段是使每个client/task节点的训练数据分布不同 …

分布式机器学习常用数据集

2021 年 11 月 28 日
笔记

今天开始跑分布式机器学习论文实验了，这里介绍一下论文的常用数据集（因为我的研究领域是分布式机器学习，所以下面列出的数据集 …

自适应查询执行：在运行时提升Spark SQL执行性能

2020 年 12 月 21 日
笔记

前言 Catalyst是Spark SQL核心优化器，早期主要基于规则的优化器RBO，后期又引入基于代价进行优化的CBO …

分布式机器学习：模型平均MA与弹性平均EASGD（PySpark）

分布式机器学习：同步并行SGD算法的实现与复杂度分析（PySpark）

Spark: 单词计数(Word Count)的MapReduce实现(Java/Python)

Hadoop: 单词计数(Word Count)的MapReduce实现

Hive on Spark和Spark sql on Hive，你能分的清楚么

并行Louvain社区检测算法

分布式机器学习中的模型架构

分布式机器学习中的模型聚合

分布式机器学习常用数据集

自适应查询执行：在运行时提升Spark SQL执行性能

VirMach 便宜 VPS

QNews

分布式机器学习：模型平均MA与弹性平均EASGD（PySpark）

分布式机器学习：同步并行SGD算法的实现与复杂度分析（PySpark）

Spark: 单词计数(Word Count)的MapReduce实现(Java/Python)

Hadoop: 单词计数(Word Count)的MapReduce实现

Hive on Spark和Spark sql on Hive，你能分的清楚么

并行Louvain社区检测算法

分布式机器学习中的模型架构

分布式机器学习中的模型聚合

分布式机器学习常用数据集

自适应查询执行：在运行时提升Spark SQL执行性能

VirMach 便宜 VPS

QNews

热门搜寻