value-rnn-td

Public

使用时序差分学习 (TD learning) 训练一个循环神经网络 (RNN) 来估计部分可观测马尔可夫决策过程 (POMDP) 中的状态价值。

pomdp pytorch rnn td-learning

创建时间：2022-02-26T23:05:43

更新时间：2023-10-11T10:47:30

Stars

Stars Increase

相关项目

Stable Diffusion Webui

Stable Diffusion 的网页版界面

151380

9个月前

+49today

Keras

data-science

人类的深度学习

62884

20小时前

Annotated_deep_learning_paper_implementations

attention

60多个深度学习论文的实现/教程，并附带旁注；涵盖Transformer（原始版、XL、Switch、Feedback、ViT等）、优化器（Adam、AdaBelief、Sophia等）、GAN（CycleGAN、StyleGAN2等）、强化学习（PPO、DQN）、Capsule网络、知识蒸馏等。

60082

17小时前

+41today

Real Time Voice Cloning

deep-learning

只需5秒钟克隆语音，即可实时生成任意语音内容

54005

17小时前

+8today

Yolov5

coreml

将 YOLOv5 模型（基于 PyTorch 框架）转换为 ONNX、CoreML 和 TFLite 格式。

53461

6个月前

+19today

Vllm

Hot

amd

一种高效且内存利用率高的用于大型语言模型推理和服务的引擎

45180

11个月前

+107today

LLMs From Scratch

Hot

一步一步用PyTorch从零开始实现一个类似ChatGPT的大型语言模型。

44505

7个月前

+101today

Ailearning

adaboost

人工智能学习：涵盖数据分析、机器学习实战、线性代数基础、PyTorch深度学习框架、NLTK自然语言处理工具包和TensorFlow 2.x框架的使用。

40600

17小时前

+9today

Made With ML

data-engineering

学习如何设计、开发、部署和迭代生产级别的机器学习应用。

38418

8个月前

+1today

DeepSpeed

billion-parameters

DeepSpeed是一个深度学习优化库，它使分布式训练和推理变得轻松、高效且有效。

37975

18小时前

+17today

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

value-rnn-td

相关项目

Stable Diffusion Webui

Keras

Annotated_deep_learning_paper_implementations

Real Time Voice Cloning

Yolov5

Vllm

LLMs From Scratch

Ailearning

Made With ML

DeepSpeed