Search results for: yannickilcher

All Videos Channels

4 years ago
DeBERTa: Decoding-enhanced BERT with Disentangled Attention (Machine Learning Paper Explained)
ykilcher
2
0
43
3 years ago
Multimodal Neurons in Artificial Neural Networks (w/ OpenAI Microscope, Research Paper Explained)
ykilcher
128
3 years ago
[ML News] AI-generated patent approved | Germany gets an analog to OpenAI | ML cheats video games
ykilcher
34
3 years ago
Decision Transformer: Reinforcement Learning via Sequence Modeling (Research Paper Explained)
ykilcher
53
2 years ago
The hidden dangers of loading open-source AI models (ARBITRARY CODE EXPLOIT!)
ykilcher
21
2
22
3 years ago
MLP-Mixer: An all-MLP Architecture for Vision (Machine Learning Research Paper Explained)
ykilcher
170
1 year ago
[ML News] Geoff Hinton leaves Google | Google has NO MOAT | OpenAI down half a billion
ykilcher
60
1 year ago
Retentive Network: A Successor to Transformer for Large Language Models (Paper Explained)
ykilcher
64
1 year ago
This ChatGPT Skill will earn you $10B (also, AI reads your mind!) | ML News
ykilcher
51
4 years ago
Linear Transformers Are Secretly Fast Weight Memory Systems (Machine Learning Paper Explained)
ykilcher
32
3 years ago
[ML News] DeepMind tackles Math | Microsoft does more with less | Timnit Gebru launches DAIR
ykilcher
14
1
3 years ago
Learning Rate Grafting: Transferability of Optimizer Tuning (Machine Learning Research Paper Review)
ykilcher
55
3 years ago
Language Models as Zero-Shot Planners: Extracting Actionable Knowledge for Embodied Agents (+Author)
ykilcher
36
3 years ago
Gradients are Not All You Need (Machine Learning Research Paper Explained)
ykilcher
10
3 years ago
GPT-NeoX-20B - Open-Source huge language model by EleutherAI (Interview w/ co-founder Connor Leahy)
ykilcher
29
3 years ago
PonderNet: Learning to Ponder (Machine Learning Research Paper Explained)
ykilcher
126
55
93
3 years ago
Fastformer: Additive Attention Can Be All You Need (Machine Learning Research Paper Explained)
ykilcher
59
15
25
2 years ago
This is a game changer! (AlphaTensor by DeepMind explained)
ykilcher
27
5
123
3 years ago
Grokking: Generalization beyond Overfitting on small algorithmic datasets (Paper Explained)
ykilcher
48
14
23
3 years ago
Inconsistency in Conference Peer Review: Revisiting the 2014 NeurIPS Experiment (Paper Explained)
ykilcher
69
16
47
3 years ago
[ML News] Microsoft trains 530B model | ConvMixer model fits into single tweet | DeepMind profitable
ykilcher
110
30
121
1 year ago
Recipe AI suggests FATAL CHLORINE GAS Recipe
ykilcher
6
2 years ago
Parti - Scaling Autoregressive Models for Content-Rich Text-to-Image Generation (Paper Explained)
ykilcher
2
0
3
2 years ago
The Man behind Stable Diffusion
ykilcher
25
2 years ago
Video PreTraining (VPT): Learning to Act by Watching Unlabeled Online Videos (Paper Explained)
ykilcher
19

DeBERTa: Decoding-enhanced BERT with Disentangled Attention (Machine Learning Paper Explained)

Multimodal Neurons in Artificial Neural Networks (w/ OpenAI Microscope, Research Paper Explained)

[ML News] AI-generated patent approved | Germany gets an analog to OpenAI | ML cheats video games

Decision Transformer: Reinforcement Learning via Sequence Modeling (Research Paper Explained)

The hidden dangers of loading open-source AI models (ARBITRARY CODE EXPLOIT!)

MLP-Mixer: An all-MLP Architecture for Vision (Machine Learning Research Paper Explained)

[ML News] Geoff Hinton leaves Google | Google has NO MOAT | OpenAI down half a billion

Retentive Network: A Successor to Transformer for Large Language Models (Paper Explained)

This ChatGPT Skill will earn you $10B (also, AI reads your mind!) | ML News

Linear Transformers Are Secretly Fast Weight Memory Systems (Machine Learning Paper Explained)

[ML News] DeepMind tackles Math | Microsoft does more with less | Timnit Gebru launches DAIR

Learning Rate Grafting: Transferability of Optimizer Tuning (Machine Learning Research Paper Review)

Language Models as Zero-Shot Planners: Extracting Actionable Knowledge for Embodied Agents (+Author)

Gradients are Not All You Need (Machine Learning Research Paper Explained)

GPT-NeoX-20B - Open-Source huge language model by EleutherAI (Interview w/ co-founder Connor Leahy)

PonderNet: Learning to Ponder (Machine Learning Research Paper Explained)

Fastformer: Additive Attention Can Be All You Need (Machine Learning Research Paper Explained)

This is a game changer! (AlphaTensor by DeepMind explained)

Grokking: Generalization beyond Overfitting on small algorithmic datasets (Paper Explained)

Inconsistency in Conference Peer Review: Revisiting the 2014 NeurIPS Experiment (Paper Explained)

[ML News] Microsoft trains 530B model | ConvMixer model fits into single tweet | DeepMind profitable

Recipe AI suggests FATAL CHLORINE GAS Recipe

Parti - Scaling Autoregressive Models for Content-Rich Text-to-Image Generation (Paper Explained)

The Man behind Stable Diffusion

Video PreTraining (VPT): Learning to Act by Watching Unlabeled Online Videos (Paper Explained)