大模型概述1

张开发

• 2026/4/11 19:02:46 • 15 分钟阅读

分享文章

一个中文字符大约0.6个token一个英文单词一般0.3个token不同的大模型有自己不同的tokenize。令牌化的方法。FLOPs算力的参数多少此浮点型运算大模型分类分类方式一多模态的多种形态的模型专门处理文本语言大模型多模态理解大模型图生文非文本模态转换为文本多模态生成大模型文生图文本模态转换为非文本模态。模态文本语音图像视频巴拉巴拉的。大模型4要素大模型权重参数推理代码训练代码不开源训练数据集不开源大语言模型训练范式1.预训练模型 --》学知识预训练学习下一个Token的概率分布情况。这个环节模型具备的是词语接龙而不是对话的能力。但无法保证回答是否有用是否符合人类偏好是否安全是否合规。大量数据塞入预训练学分布。高手但是什么规矩也不懂2. SFT--》学会按指令回答问题 Supervised Fine-Tuning监督微调让模型学会如何按指令和执行特定任务这样只能学到类人但是没有办法真的完全是人。SFT1.标注成本高难以全面覆盖场合。微调不用计算机集群去实现微调。但需要大量的高质量数据。3.RLHF --》学会人类偏好对最好的回答做奖励。反套路必备避免奶奶难题模型的训练过程与推理过程大模型工程实现AIGC跟AGIAIGC人工智能生成。AGI通用人工智能。幻觉1.LLM不是知识库是生成模型 2.训练数据本身存在噪声或者冲突 3.RLHF强调有用回答而不是拒答 4.生成任务天然追求完整性而不是保守。1.提示词工程 2.rag 3.微调 4.续训 5.智能体开发1.提示词工程系统化地去说明任务。表达需求你想干嘛思维需要严密模型需要充当的角色目标明确背景与上下文输入格式输出格式质量与约束加上Few-shot的事例。用QA问答的方式也可以分系统提示词跟用户提示词。上下文我们历史的文字传入。上下文窗口存在长度限制。提示词工程的边界1.参考资料过多上下文窗口不够用了 2. 操作需要多步完成 3. 指令遵循能力不足。4.缺少某个垂类领域的知识点开头与结尾的模型记忆比较好。中间可能就忘了写词的时候需要给抛出异常的地方不用让大模型强撑。CoTchain of thinking ToTTree of thinking

更多文章

前端开发 2026/4/11 19:01:51

一物一码系统怎么搭建？从0到1的完整实施路径与避坑指南

在数字化转型浪潮中，一物一码已从"锦上添花"变为企业基础设施。但市面上方案繁杂，企业自建常陷入"技术选型迷茫"和"业务落地困难"。本文基于顶讯科技一物一码平台的底层架构逻辑，拆解系统搭建的完整路径&#…

张开发

前端开发 2026/4/11 18:51:25

nli-distilroberta-base企业应用：知识图谱三元组有效性自动验证

nli-distilroberta-base企业应用：知识图谱三元组有效性自动验证 1. 项目概述 nli-distilroberta-base是一个基于DistilRoBERTa模型的自然语言推理(NLI)Web服务，专门用于判断两个句子之间的逻辑关系。这项技术在知识图谱构建和维护中具有重要价值&#…

张开发

前端开发 2026/4/11 18:44:09

从Kinetics到MM-Debiased：我们为多模态模型构建了一个‘公平竞技场’数据集

构建公平竞技场：多模态数据集设计的革命性突破与实战指南在人工智能的演进历程中，多模态学习正从实验室走向产业应用的最前沿。当我们审视当前主流的多模态基准测试时，一个不容忽视的问题浮出水面：这些数据集是否真实反映了模型在…

张开发

前端开发 2026/4/11 18:42:20

语音合成中的韵律建模新方法

会议 ICASSP 2021 相关论文 “Prosodic representation learning and contextual sampling for neural text-to-speech”“CAMP: A two-stage approach to modelling prosody in context” 在ICASSP 2021上，某机构的文本到语音团队展示了两篇关于从文本合成具有上下…

张开发

前端开发 2026/4/11 18:42:20

实时行情系统设计：从协议选择到高可用架构，再到数据源选型偶

一、核心问题及解决方案（按踩坑频率排序） 问题 1：误删他人持有锁——最基础也最易犯的漏洞成因：释放锁时未做身份校验，直接执行 DEL 命令删除键。典型场景：服务 A 持有锁后，业务逻辑耗时超过锁…

张开发

前端开发 2026/4/11 18:42:14

数据错了，大家都在甩锅！数据认责到底要怎么做？

编辑：老彭来源：大数据架构师彭友们好，我是老彭。做数据治理这么多年，老彭见过最多的内耗场景，没有之一，就是数据出问题了，没人认、没人管，全都在甩锅！业务部门说&#…

张开发

前端开发 2026/4/11 18:40:13

BettaFish舆情分析系统部署避坑指南：从环境搭建到一键启动的实战经验总结

1. BettaFish舆情分析系统部署前的关键准备部署BettaFish舆情分析系统前，硬件和软件环境的准备至关重要。我见过太多开发者因为基础环境没配好，导致后续安装过程频频报错。根据实战经验，建议准备以下配置： 硬件要求： …

张开发

前端开发 2026/4/11 18:37:17

mcMMO：为你的Minecraft服务器添加终极RPG体验的完整指南

mcMMO：为你的Minecraft服务器添加终极RPG体验的完整指南【免费下载链接】mcMMO The RPG Lovers Mod! 项目地址: https://gitcode.com/gh_mirrors/mc/mcMMO mcMMO是Minecraft服务器上最受欢迎的RPG模组之一，通过14种独特的技能系统和深度角色成长…

张开发