2024-10-28-聚类分析
虽然是课上第一次学(噢不对,应该是在素红奶奶课上第一次学),但实际上之前已经学过很多次,现在对其数学原理进行进一步分析:
聚类分析属于非监督分类,也就是说基本上无先验知识可依据或参考。 聚类分析根据模式之间的相似性对模式进行分类,对一批没有标出类别的模式样本集,将相似的归为一类,不相似的归为另一类。
相似性
对于特征...
虽然是课上第一次学(噢不对,应该是在素红奶奶课上第一次学),但实际上之前已经学过很多次,现在对其数学原理进行进一步分析:
聚类分析属于非监督分类,也就是说基本上无先验知识可依据或参考。 聚类分析根据模式之间的相似性对模式进行分类,对一批没有标出类别的模式样本集,将相似的归为一类,不相似的归为另一类。
对于特征...
金融领域交互式自证业务中涵盖信用成长、用户开户、商家入驻、职业认证、商户解限等多种应用场景,通常都需要用户提交一定的材料(即凭证)用于证明资产收入信息、身份信息、所有权信息、交易信息、资质信息等,而凭证的真实性一直是困扰金融场景自动化审核的一大难题。随着数字媒体编辑技术的发展,越来越多的AI手段和工具能够轻易对凭证材料进...
学习数据包中如何表示协议和分层。它们是课本第 1.3 节和第 1.4 节中涉及的构建网络的关键概念(指的是top-down那本书)。在做实验前,请先复习这两节内容。
在深度学习中,当优化到某个地方,参数对损失的微分为零时,梯度下降就无法更新参数了。这时候可能有两种情况:
鞍点不是局部最小值,但梯度为零。把以上两种统称为 越训练分越低了。。。
前面尝试了3次不同的调节学习率和学习次数,发现结果都不怎么样。。。
之前用百度的千帆训练过一次大模型,当时使用了RAG,这次来探索下使用讯飞的大模型进行训练。 也是第一次参加Datawhale的AI夏令营,有什么写的不好或者有问题的欢迎指出!
代码的注释copy了Datawhale的文档,不过大部分都在下面写了些...
2024-08-23-LoRA
2024-08-23-Datawhale_AI夏令营_动手学大模型应用全栈开发_Task1
2024-08-15-Datawhale_AI夏令营_第四期从零入门大模型微调Task3笔记
前情提要
一个是初始的学习率0.0008和10...
2024-08-14-Datawhale_AI夏令营_第四期从零入门大模型微调Task1&2笔记
前言