算法部署-使用TensorRT-LLM部署大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip

课程资源代码

算法部署-使用TensorRT-LLM部署大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip 算法部署-使用TensorRT-LLM部署大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip算法部署-使用TensorRT-LLM部署大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip算法部署-使用TensorRT-LLM部署大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip算法部署-使用TensorRT-LLM部署大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip算法部署-使用TensorRT-LLM部署大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip算法部署-使用TensorRT-LLM部署大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip算法部署-使用TensorRT-LLM部署大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip算法部署-使用TensorRT-LLM部署大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip算法部署-使用TensorRT-LL

文件下载

资源详情

[{"title":"（ 47 个子文件 6.36MB ）算法部署-使用TensorRT-LLM部署大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip","children":[{"title":"TensorRT-LLM-ChatGLM3-main","children":[{"title":"app.py 5.38KB ","children":null,"spread":false},{"title":"vLLM","children":[{"title":"results.txt 750B ","children":null,"spread":false},{"title":"langchang_chatglm3_vllm.py 405B ","children":null,"spread":false},{"title":"chatglm3_quant_awq.py 773B ","children":null,"spread":false},{"title":"offline_chatglm3.py 564B ","children":null,"spread":false},{"title":"prompts.txt 22B ","children":null,"spread":false},{"title":"model_repo","children":[{"title":"vllm_model","children":[{"title":"config.pbtxt 1.70KB ","children":null,"spread":false},{"title":"1","children":[{"title":"model.json 247B ","children":null,"spread":false}],"spread":true}],"spread":true}],"spread":true},{"title":"client.py 8.08KB ","children":null,"spread":false}],"spread":true},{"title":"Triton大模型部署.pdf 7.41MB ","children":null,"spread":false},{"title":"tensorrt_llm","children":[{"title":"run_hf.py 1.94KB ","children":null,"spread":false},{"title":"utils.py 3.78KB ","children":null,"spread":false},{"title":"__init__.py 0B ","children":null,"spread":false},{"title":"quantize.py 5.64KB ","children":null,"spread":false},{"title":"see_chatglm3_model.py 406B ","children":null,"spread":false},{"title":"process.py 1.39KB ","children":null,"spread":false},{"title":"smoothquant.py 5.14KB ","children":null,"spread":false},{"title":"requirements.txt 75B ","children":null,"spread":false},{"title":"run_chat_trt.py 7.83KB ","children":null,"spread":false},{"title":"build.py 28.32KB ","children":null,"spread":false},{"title":"weight.py 24.33KB ","children":null,"spread":false},{"title":"visualize.py 2.70KB ","children":null,"spread":false}],"spread":false},{"title":"langchain_chatglm3.py 4.21KB ","children":null,"spread":false},{"title":"triton_inference_server","children":[{"title":"model_repo","children":[{"title":"postprocessing","children":[{"title":"config.pbtxt 2.85KB ","children":null,"spread":false},{"title":"1","children":[{"title":"model.py 9.15KB ","children":null,"spread":false},{"title":"__pycache__","children":[{"title":"model.cpython-310.pyc 4.79KB ","children":null,"spread":false}],"spread":true}],"spread":true}],"spread":true},{"title":"ensemble","children":[{"title":"config.pbtxt 9.47KB ","children":null,"spread":false}],"spread":true},{"title":"tensorrt_llm","children":[{"title":"config.pbtxt 8.03KB ","children":null,"spread":false}],"spread":true},{"title":"tensorrt_llm_bls","children":[{"title":"config.pbtxt 4.46KB ","children":null,"spread":false},{"title":"1","children":[{"title":"model.py 15.16KB ","children":null,"spread":false},{"title":"__pycache__","children":[{"title":"model.cpython-310.pyc 7.00KB ","children":null,"spread":false}],"spread":false}],"spread":true}],"spread":true},{"title":"preprocessing","children":[{"title":"config.pbtxt 3.54KB ","children":null,"spread":false},{"title":"1","children":[{"title":"model.py 14.70KB ","children":null,"spread":false},{"title":"__pycache__","children":[{"title":"model.cpython-310.pyc 8.53KB ","children":null,"spread":false}],"spread":false}],"spread":true}],"spread":true}],"spread":true}],"spread":true},{"title":"img","children":[{"title":"content.jpg 92.08KB ","children":null,"spread":false},{"title":"face.jpg 43.81KB ","children":null,"spread":false}],"spread":true},{"title":"service","children":[{"title":"knowledge_service.py 3.09KB ","children":null,"spread":false},{"title":"utils.py 3.78KB ","children":null,"spread":false},{"title":"__init__.py 58B ","children":null,"spread":false},{"title":"chatglm_service.py 1.51KB ","children":null,"spread":false},{"title":"chatglm_triton_service.py 9.33KB ","children":null,"spread":false},{"title":"chatglm_trtllm_service.py 6.90KB ","children":null,"spread":false},{"title":"config.py 593B ","children":null,"spread":false}],"spread":true},{"title":"langchain_chatglm3_triton.py 4.11KB ","children":null,"spread":false},{"title":"end_to_end_grpc_client.py 11.98KB ","children":null,"spread":false},{"title":"requirements.txt 304B ","children":null,"spread":false},{"title":"README.md 591B ","children":null,"spread":false}],"spread":false}],"spread":true}]

评论信息

其他资源

免责申明

【只为小站】的资源来自网友分享，仅供学习研究，请务必在下载后24小时内给予删除，不得用于其他任何用途，否则后果自负。基于互联网的特殊性，【只为小站】无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查；无论【只为小站】经营者是否已进行审查，用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场，基于网友分享，根据中国法律《信息网络传播权保护条例》第二十二条之规定，若资源存在侵权或相关问题请联系本站客服人员，zhiweidada#qq.com，请把#换成@，本站将给予最大的支持与配合，做到及时反馈和处理。关于更多版权及免责申明参见版权及免责申明

算法部署-使用TensorRT-LLM部署大模型-附详细优化+分析流程教程-优质大模型部署项目实战.zip

文件下载

资源详情

评论信息

其他资源

免责申明

个人信息

相关资源标签

热门下载

最新下载