内容概要:本文详细介绍了人工智能大模型DeepSeek及其在市场监管领域的多种应用场景。首先回顾了人工智能及大模型的发展历程,涵盖不同阶段的特点和技术进步。随后着重介绍了DeepSeek的核心能力和使用方法,包括自然语言处理、风险评估等多个方面的能力。最后列举了DeepSeek在多个具体应用场景中的表现,如企业名称推荐、食品安全检测、信用评级等,并概述了落地实施的具体路径。 适合人群:对人工智能感兴趣的研究人员、政府部门工作人员、希望提升自身业务技术水平的从业者以及想要了解AI技术应用的实际效果的专业人士。 使用场景及目标:适用于市场监管领域的多样化工作任务。例如:为企业提供合法且新颖的名字推荐服务;帮助企业快速找到最新的标准和规则变化,确保运营合规;判断市场行为是否违反公平竞争的原则;通过智能算法提高日常工作的效率与质量;协助执法人员准确高效处理各类违法情况;增强公共监督力度,保证透明度;支持科学决策,为政策制定提供强有力的数据支撑。 阅读建议:由于本报告涉及内容广泛且专业术语较多,建议读者先通读全文以掌握大致脉络,对于感兴趣的部分可以多次深入研读,并结合自身的实践进行理解和应用。同时关注官方更新和技术文档来获得更多细节和支持。此外,对于某些较为复杂的概念或技术,可能还需要额外查阅资料以便更好地理解文中提到的理念和技术背景。
2025-06-20 15:30:06 5.17MB 人工智能
1
随着人工智能技术的迅猛发展,医疗问答系统已成为医疗信息检索和知识获取的重要工具。医疗领域涉及大量医学术语、复杂的疾病症状和治疗方案,传统查询方式难以高效、准确地满足医护人员和患者的信息需求。相比传统国内搜索引擎和原生开源大语言模型(LLMs),基于LangChain的大模型医疗问答系统能够提供更高质量的答案,显著提升医疗知识检索的效率和精准度。因此,本研究提出了一种基于LangChain与大模型的医疗智能问答系统,结合命名实体识别(NER)、图谱查询和对话分析等技术,构建了一个专注于医疗领域的知识图谱及其查询与生成模块。通过设计和优化Prompt提示词,Agent Tool提升了大模型生成更精准、高质量医疗问答的能力。研究结果表明,该系统在医疗问答任务中的表现优异,准确度、方案可行性和上下文相关性等指标显著优于传统LLMs和国内知名大模型。该系统通过与大规模医疗知识图谱的结合,能够深入理解复杂的医疗问题,并提供精准的回答,呈现可视化图谱展示图,更直观地给用户反馈,同时具备较高的数据安全性和可迁移性。
2025-06-15 20:54:47 870KB 知识图谱
1
在金融领域中,随着技术的发展,风控面临着一系列新的问题和挑战。其中,欺诈手段的层出不穷以及团伙作案的隐蔽性提高,使得现有的风控系统难以应对。黑产和中介攻击手段的升级,如设备更换、联系人变化和不同作案场所等,进一步增加了风险识别的难度。此外,AI欺诈手段如换脸、换声等技术的使用,使得不法分子可以利用高逼真的生成式AI技术绕过摄像头采集,实施攻击。这些挑战导致了模型性能出现瓶颈,传统的建模方法难以应对日益高明的AI欺诈手段。 为应对这些挑战,王小东提出了基于大模型的多模态智能风控解决方案。大模型结合了自然语言处理(NLP)和计算机视觉(CV)的能力,可以对结构化和非结构化的数据进行分析处理。生成式大模型主要进行文本、视频、图像的生成,而其他非生成式大模型则以概率输出,能够在金融领域参与策略决策和应用。通过融合这些技术,金融机构可以更好地识别和预防各种新型风险。 文章中提到了一系列具体应用案例,包括身份证风控。不法分子利用各种手段对身份证进行造假,如脏污、字体造假、贴纸等,甚至进行拼接和人像替换,以绕过风控系统。此外,攻击手段还包括3D面具、电子头、AI换声等高技术含量的伪造行为。这些攻击手段的多样化和逼真性,使得金融机构必须提高其风控技术的水平。 在风控技术方案中,生成式大模型可以通过对话问答生成标签实现风控,而非生成式大模型则通过训练模型概率来实现。大模型结合小样本微调可以快速开发出针对性的风控策略。方案强调需要积累大量的正负样本,并且模型主干网络需要统一,而Head层可以不一致。 文章还探讨了大模型在金融风控中的可行性,提出将大模型与音视频通讯能力、智能客服、智能催收等多方面技术结合的可能性。例如,MaaS(Model as a Service)智能客服和智能营销能够提升客户服务效率,而RTC(Real-Time Communication)技术则可以实现实时风控。 金融风控正面临前所未有的挑战,而多模态智能风控方案的落地实践,特别是结合大模型的技术,提供了新的解决方案。这些方案不仅提高了模型性能,也拓宽了风控策略的应用范围。未来,金融风控技术将更加注重与人工智能技术的结合,以应对更加复杂和多变的风险挑战。
2025-06-14 15:05:12 10.7MB
1
大模型备案安全评估测试题是一个专门针对大模型技术产品进行安全性和合规性评估的测试体系。其目的在于确保大模型技术产品符合相关法律法规以及行业标准,保障用户数据安全和隐私保护,同时预防技术滥用带来的潜在风险。TC260,作为技术标准化组织,其制定的评估标准通常包括五大类共三十一小类细分测试项,涵盖了大模型备案安全评估的各个方面。 五大类安全评估测试项通常包括但不限于: 1. 数据安全和隐私保护:评估内容可能包括数据收集、存储、处理、传输和销毁等环节的安全性措施;用户隐私信息保护机制的有效性;以及是否符合相关数据保护法规等。 2. 算法透明度和可解释性:涉及模型决策过程的透明度,用户是否能够理解模型作出特定决策的理由;算法是否公正、无偏,是否能向用户清晰阐述模型输出结果的依据。 3. 系统安全性和鲁棒性:关注模型部署环境的安全防护措施;是否存在恶意攻击、数据篡改等安全风险;以及在异常输入或攻击下系统是否能保持稳定运行。 4. 知识产权保护:评估大模型在训练过程中对第三方知识产权的保护措施;是否避免了非法使用他人受版权保护的数据集或算法。 5. 合规性与法律责任:包括大模型产品在各个国家和地区实施时必须遵守的法律法规;对违反相关规定的后果和法律责任的评估。 生成内容测试题是指为了检测大模型是否能够在符合安全和合规性的前提下,生成符合特定标准和要求的文本内容。这类测试题有助于评估模型在实际应用中的表现,确保其产出的文本内容不仅有恰当的信息表达,还要符合道德、法律和行业规范。 应拒答测试题,顾名思义,是指在模型面对某些不当请求或信息时,应能够明确拒绝并给出合适的反馈。这样的测试旨在检验大模型是否具有基本的伦理判断能力,以及在面对可能损害用户或他人利益的请求时,能否保持正确的行为指导。 非拒答测试题则关注大模型在处理正常请求时的表现。这类测试要求模型能够在不违反安全和合规标准的情况下,有效响应用户的合法请求,并提供所需的服务或信息。 在评估大模型备案安全的过程中,上述测试题的设计和实施至关重要。通过这些测试,不仅能够确保大模型技术产品在上市前满足了安全合规的要求,还能对模型的潜在风险进行有效控制,保证技术的安全、可靠和负责任的使用。
2025-06-05 10:02:36 2.18MB
1
机器学习模型案例与SHAP解释性分析:涵盖类别与数值预测,CatBoost、XGBoost等六大模型深度解析及SHAP分析比较,shap分析代码案例,多个机器学习模型+shap解释性分析的案例,做好的多个模型和完整的shap分析拿去直接运行,含模型之间的比较评估。 类别预测和数值预测的案例代码都有,类别预测用到的6个模型是(catboost、xgboost、knn、logistic、bayes,svc),数值预测用到的6个模型是(线性回归、随机森林、xgboost、lightgbm、支持向量机、knn),机器学习模型; SHAP解释性分析; 多个模型比较评估; 类别预测模型(catboost、xgboost、knn、logistic、bayes、svc); 数值预测模型(线性回归、随机森林、xgboost、lightgbm、支持向量机、knn); 完整shap分析代码案例; 模型之间比较评估。,"多模型SHAP解释性分析案例集:类别预测与数值预测的全面比较评估"
2025-06-02 20:17:41 47KB
1
内容概要:本文详细阐述了通过Ollama工具在Linux环境下部署DeepSeek(一款高效的大规模语言模型)的步骤,并针对网络环境不佳的情况提供了解决方案。重点讨论了安装Ollama的具体命令及其常见问题处理办法,同时介绍了如何利用Ollama拉取DeepSeek模型并将其集成至Chatbox以实现实时聊天互动。此外,文中还提及了远程服务器配置以及资源占用情况分析。 适用人群:适合对大规模语言模型有兴趣的技术爱好者和专业开发人员,特别是那些希望通过简单便捷的方式将此类先进的人工智能应用于个人项目的研究者们。 使用场景及目标:帮助读者掌握如何在家用级别的硬件设备上部署先进的深度学习应用程序,使他们能够在有限条件下享受强大的自然语言处理能力所带来的便利;同时也为希望探索更大规模应用场景的专业人士提供了宝贵的实践经验。 其他说明:本文不仅涵盖了具体的安装指南和技术细节讲解,还分享了一些实用技巧,如通过调整远程服务器设置提高跨网段连接的成功率,以及关注模型部署过程中所涉及的各种资源开销等问题。
2025-06-02 08:52:18 17KB Linux部署
1
浦东教育发展研究院浦东新区中小幼教师DeepSeek等大模型使用指南v1.0100页.pdf
2025-05-30 18:03:54 14.12MB
1
在人工智能和自然语言处理领域,大语言模型因为其在理解、生成语言方面的能力,已经在多个场景中发挥重要作用。大模型通过在大规模数据集上的预训练,可以掌握丰富的世界知识,并在多任务中展示其处理能力。然而,由于预训练数据的局限性,大模型在特定的垂直领域,例如医学、金融、法学等,往往缺乏足够的专业知识,难以胜任专业领域内的任务。为了使大模型更好地适应这些领域,通常需要进行领域适配,而这通过简单的提示工程是难以完成的。 参数高效微调技术(Parameter-Efficient Fine-Tuning, PEFT)因此应运而生,它旨在降低微调大型模型的成本,同时提高效率。微调是通过在特定任务或领域的数据集上对模型参数进行训练,以增强模型在该任务或领域的性能。在参数高效微调中,这个过程不再要求对模型的所有参数进行更新,而是选择性地调整模型的部分参数,或者通过其他机制来实现模型性能的提升。 本章主要介绍了当前主流的参数高效微调技术,首先简要介绍参数高效微调的概念、参数效率和方法分类,然后详细介绍参数高效微调的三类主要方法,包括参数附加方法、参数选择方法和低秩适配方法,并探讨它们各自代表性算法的实现和优势。本章通过具体案例展示参数高效微调在垂直领域的实际应用。 参数附加方法是通过向模型中添加新的参数来实现微调,而这些参数的数量相比整个模型来说相对较小,从而实现成本的降低。例如,Adapters是参数附加方法的一个典型例子,它们被设计成可插拔的模块,可以针对特定的任务训练,而不影响模型的其余部分。 参数选择方法则是在现有的模型参数中选择一部分进行训练,这种方法的核心在于参数选择策略,如何在保持性能的同时,最大程度减少需要训练的参数数量。比如,基于稀疏性的方法通过设置阈值来确定哪些参数是重要的,而哪些可以保持不变。 低秩适配方法是通过引入低秩结构来近似模型的权重更新,通过这种方式,可以以更少的参数来模拟整个模型的更新,从而在计算上更为高效。低秩方法可以是基于张量分解的技术,或者通过引入低秩矩阵来近似整个权重矩阵的更新。 为了实现效果可靠、成本可控的参数高效微调,我们需要对这些方法进行深入的研究和实践。每种方法都有其特定的优势和局限性,选择合适的方法需要根据实际任务的需求和资源的限制来决定。通过这些技术,大模型在垂直领域的应用将变得更加可行和高效。 无论是在医学、金融还是法学领域,参数高效微调技术都有望为大模型在这些专业领域中的应用打开新的大门。它不仅能够增强模型在垂直领域的适应性和准确性,而且还能降低对计算资源的需求,使得大模型更加经济和环保。随着技术的不断进步和优化,我们可以期待参数高效微调技术在未来将得到更广泛的应用,从而推动人工智能在各行各业的深入发展。
2025-05-26 14:04:17 2.8MB
1
【阿里云-2024研报-】大模型安全研究报告(2024年) 大模型技术的演进与影响 自2017年起,大模型技术经历了预训练语言模型的探索期,到语言大模型的爆发期,再到当前的多模态大模型提升期,这些阶段标志着人工智能从专用弱智能向通用强智能的转变。这一技术进步不仅提升了智能水平,还带来了人机交互方式和应用研发模式的重大变革。大模型技术的广泛应用,为第四次工业革命提供了强大的动力和创新潜力。 大模型安全挑战 随着大模型技术在商业化应用和产业化落地过程中的加速,一些原有人工智能安全风险得到加剧,同时也催生了新型风险,例如模型“幻觉”、指令注入攻击、网络攻击平民化等。此外,数据合规获取、数据标注安全、数据集安全检测等问题也凸显了系统平台和业务应用安全风险。 大模型安全框架 为了防范和消减大模型的安全风险,并促进其在安全领域的应用,本报告提出了一份大模型安全框架,涵盖以下四个方面的内容: 1. 安全目标:明确大模型安全的总体目标。 2. 安全属性:包括大模型自身的安全特性。 3. 保护对象:确定需要保护的关键对象。 4. 安全措施:提供相应的保护措施。 此外,报告还提出了大模型赋能安全框架,关注大模型在网络安全、数据安全、内容安全等领域的安全赋能作用。 报告编制单位与版权声明 本报告由阿里云计算有限公司联合中国信息通信研究院以及三十余家行业单位共同编制。报告的版权属于阿里云计算有限公司与中国信息通信研究院共同拥有,任何个人或机构在使用本报告内容时必须注明出处,否则将依法追究法律责任。 大模型技术产业与安全展望 报告对大模型技术产业的未来进行了展望,强调了在技术发展的同时,安全治理的重要性。国际组织和世界主要国家正在通过制定治理原则、完善法律法规、研制技术标准等方式积极应对大模型安全问题。未来,随着技术的进一步发展,大模型在逻辑推理、任务编排等方面的能力将为解决网络空间安全瓶颈问题带来新的机遇。 大模型自身安全与赋能安全的具体措施 1. 大模型自身安全框架提出了系统平台安全措施、训练数据安全保护、算法模型安全保护、业务应用安全保护等策略。 2. 大模型赋能安全框架则从风险识别、安全防御、安全检测、安全响应、安全恢复等方面,为不同应用场景提供安全赋能。 报告目录结构 报告目录详细划分了各个章节,包括大模型安全概述、大模型自身安全、大模型赋能安全以及大模型安全展望等部分,具体罗列了模型“幻觉”缓解、模型偏见缓解、模型可解释性提升、系统平台安全措施、输入输出安全保护、账号恶意行为风控、自动化数据分类分级等关键点。 总结而言,阿里云与合作伙伴共同编撰的《大模型安全研究报告(2024年)》,不仅是对大模型技术演进和安全挑战的深入剖析,更是对未来大模型技术产业安全治理和发展趋势的全面展望,为相关领域的发展提供了科学的参考依据。
2025-05-26 11:10:37 5.8MB 研究报告
1
项目的核心目标是实现以下三点: 1. 提升数据分析能力:通过对大量农业数据的深度学习,模型能够识别出影响作物生长的关键因素,为农民提供科学的种植建议。 2. 优化资源配置:根据模型分析结果,系统能够指导农民合理配置水、肥料和农药等资源,减少浪费,提高资源使用效率。 3. 增强决策支持功能:通过实时监控和预测农业生产状况,模型能够帮助农民做出更明智的决策,如最佳种植时间、病虫害防治措施等。
2025-05-22 17:33:06 589KB 智能农业 数据预处理 模型部署
1