🛠工具与编程 🤖人工智能
| 话题 | 回复 | 浏览量 | 活动 | |
|---|---|---|---|---|
|
关于“🤖人工智能”类别
|
|
0 | 170 | 2023 年11 月 1 日 |
|
如何在基础的vlm-ocr模型上结合传统的计算机视觉处理技术提高识别能力
|
|
0 | 9 | 2026 年1 月 13 日 |
|
deepseek-ocr和paddleocr-vl区别
|
|
0 | 6 | 2026 年1 月 12 日 |
|
如何安装部署deepseek-ocr且通过vllm server提供访问
|
|
0 | 3 | 2026 年1 月 12 日 |
|
中文大语言模型评测第三期
|
|
0 | 4 | 2025 年12 月 20 日 |
|
从零开始自己训练一个最小的大模型
|
|
0 | 24 | 2025 年12 月 17 日 |
|
deepseek提出把文字压缩成图片token然后处理,可以节省算力
|
|
0 | 8 | 2025 年12 月 4 日 |
|
python实体提取学习笔记
|
|
0 | 9 | 2025 年12 月 2 日 |
|
中文实体提取数据集
|
|
0 | 15 | 2025 年12 月 2 日 |
|
语言模型实体提取简介
|
|
0 | 7 | 2025 年12 月 2 日 |
|
KL散度KL divergence
|
|
0 | 7 | 2025 年11 月 25 日 |
|
交叉熵损失cross entropy loss
|
|
0 | 0 | 2025 年11 月 25 日 |
|
【转载】如何测评大模型对长文本处理的性能
|
|
0 | 11 | 2025 年11 月 25 日 |
|
【转载】大模型有哪些评估指标?
|
|
0 | 4 | 2025 年11 月 25 日 |
|
【转载】什么是困惑度perplexity
|
|
0 | 3 | 2025 年11 月 25 日 |
|
大模型评测工具DeepEval
|
|
0 | 6 | 2025 年11 月 25 日 |
|
【转载】大语言模型评估的常用方法、指标与框架
|
|
0 | 13 | 2025 年11 月 24 日 |
|
大模型如何评测?
|
|
0 | 7 | 2025 年11 月 24 日 |
|
大语言模型控制浏览器-nanobrowser
|
|
0 | 7 | 2025 年11 月 2 日 |
|
从零开始训练nanogpt
|
|
0 | 4 | 2025 年10 月 15 日 |
|
预训练语言模型发展史
|
|
1 | 10 | 2025 年10 月 8 日 |
|
支持向量机SVM简介
|
|
0 | 4 | 2025 年10 月 6 日 |
|
感知机简介
|
|
0 | 3 | 2025 年10 月 6 日 |
|
马尔科夫链简介
|
|
0 | 5 | 2025 年10 月 5 日 |
|
BERT和GPT区别
|
|
0 | 3 | 2025 年10 月 5 日 |
|
SOTA简介
|
|
0 | 6 | 2025 年10 月 5 日 |
|
残差网络简介
|
|
0 | 3 | 2025 年10 月 5 日 |
|
强化学习概述
|
|
0 | 4 | 2025 年10 月 5 日 |
|
世界模型概述
|
|
0 | 4 | 2025 年10 月 5 日 |
|
CUDA概述
|
|
0 | 7 | 2025 年10 月 5 日 |