12个重要的Colab NoteBook
- 2020 年 3 月 13 日
- 筆記

作者 | Vlad Alex
来源 | Medium
编辑 | 代码医生团队
Google Colab NoteBook可实现数据科学的民主化。允许所有人— AI研究人员,艺术家,数据科学家等。—在每台设备(甚至在智能手机)上享受机器和深度学习的功能。只需运行单元,更改参数,值和源,即可享受AI的多样性。
分享一些最喜欢的NoteBook。
图片和视频
01)Google Deep Dream

DeepDream通过神经网络可视化模式识别,解释和迭代生成。通过增加这种创造性的诠释,可以制作出类似梦想的图像。
神经网络在Pareidolia的情况下就像我们的大脑一样:它寻找熟悉的模式,这些模式是从经过训练的数据集中得出的。

上面的示例展示了大脑如何识别火星Cydonia地区岩层中的面孔。用户Nixtown 通过不断的DeepDream迭代改造了达芬奇的《蒙娜丽莎》,而AI则识别出奇怪的图案。
大脑通常会识别出不存在的图案或物体。但是如果人类感知做到了,那么为什么不应该使用AI?
链接:
GitHub
https://github.com/tensorflow/docs/blob/master/site/en/tutorials/generative/deepdream.ipynb
ColabNoteBook
https://colab.research.google.com/github/tensorflow/docs/blob/master/site/en/tutorials/generative/deepdream.ipynb
02)BigGAN

BigGAN是第一个著名的生成对抗网络。该网络在ImageNet上以现在非常低的128×128分辨率进行了训练,通过其多种生成功能,它已成为标准。
在此NoteBook中,可以从一长串类别中生成样本。


链接:
ColabNoteBook
https://colab.research.google.com/github/tensorflow/hub/blob/master/examples/colab/biggan_generation_with_tf_hub.ipynb
03)StyleTransfer

在此实验中,深度学习系统检查了两个源图像,并传递了它们的样式:不仅是颜色,而且还有形状和图案。
链接:
https://github.com/tensorflow/lucid
Colab NoteBook
https://colab.research.google.com/github/tensorflow/lucid/blob/master/notebooks/differentiable-parameterizations/style_transfer_2d.ipynb
04,05)人工智能中的ART

有许多方法可以在艺术品上训练AI。
其中之一是通过Reddit提供的:StyleGAN用来自Kaggle的24k图像对艺术品数据集进行了训练。
会得到有趣的结果,甚至可以追溯模型经过训练的原始艺术品。

另一个是由Peter Baylies等提供的WikiART StyleGAN2条件模型,由Doron Adler包装在NoteBook中:

该模型在WikiART图像上进行了训练。它甚至允许在艺术家,流派和风格之间进行选择。

图像令人印象深刻:

尝试的事情:
每个新的组合都会产生有趣的艺术品。尝试从不同时期选择具有非典型风格的艺术家。像毕加索和文艺复兴时期或希什金与流行艺术。结果有时是出乎意料的,并不总是可以理解的,但这毕竟是艺术。
链接:
C0D32_ ColabNoteBook(在24k艺术品上训练)
https://colab.research.google.com/drive/1cFKK0CBnev2BF8z9BOHxePk7E-f7TtUi
WikiART StyleGAN2 ColabNoteBook
https://colab.research.google.com/github/Norod/my-colab-experiments/blob/master/WikiArt_Example_Generation_By_Peter_Baylies.ipynb
06)样式GAN2

该网络由NVidia开发,是目前最先进的图像生成网络。它接受了高清数据集的训练(例如Flickr-Faces-HQ的Faces)。StyleGAN2提供自动学习的,无监督的高级属性分离,随机变化和具有视觉特征的图层控制。
有很多StyleGAN2-Notebooks,最喜欢的是Mikael Christensen进行的微调。
链接:
论文:
https://arxiv.org/abs/1812.04948
视频:
代码:
https://github.com/NVlabs/stylegan /
https://github.com/NVlabs/stylegan2
ColabNoteBook
https://colab.research.google.com/drive/1ShgW6wohEFQtqs_znMna3dzrcVoABKIH
尝试的事情:
NoteBook中提供了NVidia提供的各种默认数据集(请注意分辨率):

试用新的数据集。训练自己的模型,或使用由迈克尔·弗里森(Michael Friesen)等艺术家和研究人员提供的模型(跟随其Twitter进行新更新)。
细菌风格

美术风格

MC Escher-StyleGAN:

07)#DeOldify

DeOldify模型由贾森·安蒂奇允许的照片和视频有机着色。可以将栩栩如生的旧历史镜头恢复原状。同时它已实现到MyHeritage.org中。
该方法功能强大。它可以识别图案和对象,并在上面应用经过训练的视觉数据库的颜色。
例如,这些1950年代的花朵:

它也适用于视频。
链接:
GitHub
https://github.com/jantic/DeOldify
DeOldify的图像
https://colab.research.google.com/github/jantic/DeOldify/blob/master/ImageColorizerColab.ipynb
视频的DeOldify(支持各种视频平台)
https://colab.research.google.com/github/jantic/DeOldify/blob/master/VideoColorizerColab.ipynb
8)3D Ken Burns效果

3D Ken Burns效果(由Simon Niklaus等人开发)允许生成单张照片的动画3D视频素材。
尝试的事情:
在Colab Notebook中,将找到组件autozoom.py。尝试使用以下参数对其进行微调:
objectTo = process_autozoom({ 'dblShift':10.0, 'dblZoom':10000000000000000000000000000000000000000000000000000000, 'objectFrom':objectFrom }) numpyResult = process_kenburns ({ 'dblSteps':numpy.linspace(0.0,8.0,400).tolist(), “objectFrom ':objectFrom, ' objectTo':objectTo, ' boolInpaint':True })
这会夸张相机的运动-将在整个风景中飞翔。
链接:
从ArXiv上的单个图像获得3D Ken Burns效果
https://arxiv.org/abs/1909.05483
Colab Notebook
https://colab.research.google.com/drive/1hxx4iSuAOyeI2gCL54vQkpEuBVrIv1hY
9)一阶运动模型

Aliaksandr Siarohin等人的“一阶运动模型”将面部运动从视频镜头转换为图像。
链接:
项目页面
https://aliaksandrsiarohin.github.io/first-order-model-website/
GitHub
https://github.com/AliaksandrSiarohin/first-order-model
Colab NoteBook
https://colab.research.google.com/github/AliaksandrSiarohin/first-order-model/blob/master/demo.ipynb#scrollTo=UCMFMJV7K-ag
神经语言处理
10、11)GPT-2
OpenAI在2019年发布的这种语言模型接受了来自各种来源的40 GB文本的训练。有几个GPT-2 ColabNoteBook,它们的工作方式相似:输入句子的开头,然后GPT-2继续(或向提供的文本提问)。变压器驱动的模型具有“自我注意”的功能,可以在指定的距离内注意文本部分,从而可以生成连贯的故事,而不会产生混乱的现象。
更喜欢两个GPT-2NoteBook:
- Max Woolf的“训练GPT-2文本生成模型”
https://colab.research.google.com/drive/1VLG8e7YSEwypxU-noRNhsv5dW4NfTGce
- 具有 gpt2ent的Javascript接口的GPT-2
https://colab.research.google.com/drive/1VLG8e7YSEwypxU-noRNhsv5dW4NfTGce
Max Woolf的NoteBook允许:
- 通过GPT-2生成各种文本
- 训练自己的文字(最大355m模型)
用三种语言来做:
英文(关于“爱丽丝梦游仙境”)
德语(在歌德的《浮士德》中)
俄语(关于普希金的早期诗歌)

它在某种程度上适用于所有语言。当然,GPT-2接受了英语方面的训练。对于外语,应该应用微调和其他资产,但是这种概念证明对我来说是令人信服的。有一些有趣的发现:
- 在“ 浮士德”上对德语的训练越多,文本越接近原始。原因可能是在一个小的数据集中(仅一个文本)。如果想训练自己的文字,请提供更多的数据量。
- 俄语文本并不是很容易理解,但是仍然可以通过普希金的诗歌来识别其风格甚至形式。而且造币和新词是完美的,每一个前卫文学家都会为这样的发明感到自豪。
“具有Javascript接口的GPT-2”-NoteBook允许:
文本生成,不多不少。但是可以控制文本长度(这是一个非常相关的因素):

使用Temperature和top_k,您可以修改文本的随机性,重复性和“怪异性”。
使用“ 生成多少”可以生成更长的文本。
链接:
GPT-2:1.5B版本
https://openai.com/blog/gpt-2-1-5b-release/
Max Woolf的ColabNoteBook
https://colab.research.google.com/drive/1VLG8e7YSEwypxU-noRNhsv5dW4NfTGce
具有Javascript界面的GPT-2
https://colab.research.google.com/github/gpt2ent/gpt2colab-js/blob/master/GPT2_with_Javascript_interface_POC.ipynb
音乐
12)megenta:带变压器的音乐
AI也可以写音乐。在基于TensorFlow的megenta的情况下,它会像GPT-2一样使用具有自觉性的变压器,以实现谐波连贯性和一致的成分。
这是使用megenta生成的示例:

尝试的事情:
NoteBook提供了很多可能性,例如用于连续,调制,它允许.wav和.midi导出。Magenta是GoogleAI的一个项目。一件大事,它甚至包括硬件。
如果只是想听,这里是Magenta-Radio:
https://magenta.github.io/listen-to-transformer
链接:
Google.ai提供的megenta
https://magenta.tensorflow.org/
ColabNoteBook
https://colab.research.google.com/notebooks/magenta/piano_transformer/piano_transformer.ipynb
AI的民主化
这是ColabNoteBook电脑的任务-为广大读者提供使用ML / DL的可能性。使AI易于使用。提升数字意识和能力。
在这些库中,可以找到更多NoteBook:
https://github.com/tugstugi/dl-colab-notebooks
https://github.com/mrm8488/shared_colab_notebooks