Logo
  • 资讯
  • 笔记
  • AI
  • 程式语言
    • Golang
    • Python
    • JavaScript
    • JAVA
    • C#
    • C++
    • .NET
  • 框架
    • Kubernetes
    • Docker
    • Spring Boot
    • Vue.js
    • Flutter
    • Nginx
  • 数据库
    • MySQL
    • MongoDB
    • Redis
  • Linux
  • iOS
  • Android
  • 技术
    • 爬虫
    • 反向代理
  • 资讯
  • 笔记
  • AI
  • 程式语言
    • Golang
    • Python
    • JavaScript
    • JAVA
    • C#
    • C++
    • .NET
  • 框架
    • Kubernetes
    • Docker
    • Spring Boot
    • Vue.js
    • Flutter
    • Nginx
  • 数据库
    • MySQL
    • MongoDB
    • Redis
  • Linux
  • iOS
  • Android
  • 技术
    • 爬虫
    • 反向代理

Bert不完全手册9. 长文本建模 BigBird & Longformer & Reformer & Performer

  • 2022 年 10 月 8 日
  • 笔记

这一章我们来唠唠如何优化BERT对文本长度的限制。BERT使用的Transformer结构核心在于注意力机制强大的交互和 …

Continue Reading

Bert不完全手册8. 预训练不要停!Continue Pretraining

  • 2022 年 9 月 15 日
  • 笔记

paper: Don’t stop Pretraining: Adapt Language Models t …

Continue Reading

Bert不完全手册7. 为Bert注入知识的力量 Baidu-ERNIE & THU-ERNIE & KBert

  • 2022 年 8 月 18 日
  • 笔记

借着ACL2022一篇知识增强Tutorial的东风,我们来聊聊如何在预训练模型中融入知识。Tutorial分别针对NL …

Continue Reading

Bert不完全手册6. Bert在中文领域的尝试 Bert-WWM & MacBert & ChineseBert

  • 2022 年 7 月 28 日
  • 笔记

一章我们来聊聊在中文领域都有哪些预训练模型的改良方案。Bert-WWM,MacBert,ChineseBert主要从3个 …

Continue Reading

Bert不完全手册5. 推理提速?训练提速!内存压缩!Albert

  • 2022 年 5 月 13 日
  • 笔记

Albert是A Lite Bert的缩写,确实Albert通过词向量矩阵分解,以及transformer block的 …

Continue Reading

Bert不完全手册3. Bert训练策略优化!RoBERTa & SpanBERT

  • 2022 年 3 月 22 日
  • 笔记

之前看过一条评论说Bert提出了很好的双向语言模型的预训练以及下游迁移的框架,但是它提出的各种训练方式槽点较多,或多或少 …

Continue Reading

Bert不完全手册2. Bert不能做NLG?MASS/UNILM/BART

  • 2022 年 3 月 15 日
  • 笔记

Bert通过双向LM处理语言理解问题,GPT则通过单向LM解决生成问题,那如果既想拥有BERT的双向理解能力,又想做生成 …

Continue Reading

Bert不完全手册1. 推理太慢?模型蒸馏

  • 2022 年 3 月 8 日
  • 笔记

模型蒸馏的目标主要用于模型的线上部署,解决Bert太大,推理太慢的问题。因此用一个小模型去逼近大模型的效果,实现的方式一 …

Continue Reading

TensorFlow 2.0 深度学习实战 —— 浅谈卷积神经网络 CNN

  • 2021 年 12 月 7 日
  • 笔记

前言 上一章为大家介绍过深度学习的基础和多层感知机 MLP 的应用,本章开始将深入讲解卷积神经网络的实用场景。卷积神经网 …

Continue Reading

华为高级研究员谢凌曦:下一代AI将走向何方?盘古大模型探路之旅

  • 2021 年 7 月 13 日
  • 笔记

摘要:为了更深入理解千亿参数的盘古大模型,华为云社区采访到了华为云EI盘古团队高级研究员谢凌曦。谢博士以非常通俗的方式为 …

Continue Reading

VirMach 便宜 VPS

Black Friday Flash Sale

(2021/9/14~)

1 Core CPU

1 GB Ram

20 GB SSD

1年只要 USD$5 up!!!

Tips: Offer 10 分钟更新一次

New customers, 75% off for 2 months.

1 Core CPU

1 GB Ram

25 GB SSD

每月只要 USD$1.75!!!

VirMach VPS Hosting

VPSGamers VPS Hosting

VPSCraft VPS Hosting

VPShared VPS Hosting

QNews

QNews

热门搜寻

.NET .NET Core 5G AMD c# CPU处理器 docker Intel iPhone手机 JAVA javascript linux MySQL NVIDIA PC游戏 Python Redmi Windows 10 Windows操作系统 三星 华为 小米 微信 微软 新冠疫苗 新冠病毒 新冠肺炎 日本 显卡 智能手机 比亚迪 汽车 游戏 特斯拉 生科医学 电动车 电影 笔记本 算法 网友热议 美国 腾讯 芯片 苹果 马斯克
. 简体中文 大陆简体 港澳繁體 马新简体 马来西亚简体 繁體中文

Copyright © 2018-2025 广告招租