大模型api调用体验
初次体验 获取api 在智谱注册后,在https://www.bigmodel.cn/usercenter/proj-mgmt/apikeys获得api. 运行代码体验 12345678910111213from zhipuai import ZhipuAIclient = ZhipuAI(api_key="") # 请填写您自己的APIKeyresponse = client.chat.completions.create( model="glm-4-plus", # 请填写您要调用的模型名称 messages=[ {"role": "user", "content": "作为一名营销专家,请为我的产品创作一个吸引人的口号"}, {"role": "assistant", "content":...
大模型初识
待续
Pybind11做Python和C混合的demo
安装pybind11在当前项目目录下 1git submodule add -b stable https://github.com/pybind/pybind11.git extern/pybind11 创建demo.cpp1234567891011#include <pybind11/pybind11.h>int add(int i, int j) { return i + j;}PYBIND11_MODULE(cdemo, m) { m.doc() = "pybind11 example plugin"; // 可选的模块文档字符串 m.def("add", &add, "A function which adds two numbers");} 创建CMakeLists.txt1234567891011121314151617181920cmake_minimum_required(VERSION...
VAE(Variational Autoencoders)变分自编码器
参考文章CSDN博客:VAE的理解2025-01-07 为什么学习整理工作的时候发现对扩散模型的数学公式不清晰,扩散模型是在VAE的基础上发展的。 VAE是什么VAE以前的自编码器,编码器输出的只是一个编码后的数值张量。 VAE,编码器输出的是编码后的分布,故而它是一种生成式模型。 生成式网络是指根据模型学到的模式创建新的数据或内容。 简而言之,VAE的想法是训练具有正则化潜在空间的自动编码器。然后,正则化编码器被迫将数据编码为接近高斯的分布,而解码器则从潜在空间重建数据。 我们权且都把编码器,解码器当作是用万能黑盒-深度学习实现,那么是如何设置目标损失函数,使得这个思想可行的呢? 首先,我们先看一些概念定义,了解贝叶斯。 一些概念定义在一些情况,希望根据可观测变量(已知)的数据来推断不可观测变量的分布(未知),可以使用贝叶斯定理: 可观测变量 (Observed Variable):通常记为 $X$,是我们能够直接获取数据的变量。 不可观测变量 (Unobserved Variable or Latent Variable):通常记为...
Cuda基础知识
Cuda编程模型2006年,著名显卡厂商NVIDIA发布了CUDA(Compute Unified Device Architecture),是建立在NVIDIA的GPUs上的一个并行计算平台和编程模型。 在CUDA编程模型中,GPU被看作是一个协处理器,用于执行大量并行的线程运行。 程序员用类C语言编程,程序分为两部分:host端和device端。Host端是在CPU上执行的部分,而device端是在GPU上执行的部分。CUDA会把程序编译成GPU可以执行的程序,并且把数据从host端送入device端作并行处理,再把得到的多个结果从device端送回host端。 线程块的存储方式线程块的存储方式,涉及到3个层次,第一层网格(grid),第二层线程块(block),第三层线程(thread),它们的存储都可以想成是有长宽高的长方体。 如图展示的是线程和线程块均按二维排列的情况,blockDim,...