关注并星标
从此不迷路
计算机视觉研究院
公众号ID|计算机视觉研究院
学习群|扫码在主页获取加入方式
计算机视觉研究院专栏
Column of Computer Vision Institute
从技术原理、实战、应用等多维角度,共同探讨ChatGPT和大模型在当今技术领域的影响和变革
深度学习是机器学习的分支,大语言模型是深度学习的分支。
生成式AI是一种能够创造新的内容或预测未来数据的人工智能技术。
如果想训练警犬、导盲犬和猎犬,则需要特殊的训练方法。
大语言模型的训练也采用与之类似的思路。
大型语言模型被训练来解决通用(常见)的语言问题,如文本分类、问答、文档总结和文本生成等。
(1)文本分类:大型语言模型可以通过对输入文本进行分析和学习,将其归类到一个或多个预定义的类别中。例如,可以使用大型语言模型来分类电子邮件是否为垃圾邮件,或将推文归类为积极、消极或中立。
(2)问答:大型语言模型可以回答用户提出的自然语言问题。例如,可以使用大型语言模型来回答搜索引擎中的用户查询,或者回答智能助手中的用户问题。
(3)文档总结:大型语言模型可以自动提取文本中的主要信息,以生成文档摘要或摘录。例如,可以使用大型语言模型来生成新闻文章的概要,或从长篇小说中提取关键情节和事件。
(4)文本生成:大型语言模型可以使用先前学习的模式和结构来生成新的文本。例如,可以使用大型语言模型来生成诗歌、短故事、或者以特定主题的文章。
大语言模型的能力与局限,作为使用者的一些见解:
LLM是一个万能函数,而不是一个全能助手
大语言模型到可用的距离——很近,但还有点远
超长上下文
Claude 100K Context 将极大增强LLM的可用性
持久化记忆
基于向量数据库的召回检索方法精度依然无法满足多数场景的使用,分片Embedding会丢失很多局部语义信息
模型推理速度与成本
GPT-4很优秀,但费用昂贵
OpenAI最近的访谈透露,GPT-4的诸多能力受制于GPU算法短缺,正是这个原因无法开放用户微调模型权重能力
VisualCLM-6B的原理与微调
from丁铭
© THE END
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
ABOUT
计算机视觉研究院
计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
VX:2311123606
相关文章
猜你喜欢