6ch.

Forest Journal · Personal Site

Welcome to 6ch.'s Grove

AI · Embodied Intelligence · Self-directed Inquiry

上海交通大学 · 人工智能学院
在林间的宽阔里,分享学习、旅行与思考

Explore

走进这片林

笔记、杂谈与项目,像不同的林径,各自通向不同的风景。

Recent

最近更新

Trail Map

汉字森林 · 林径地图

每棵树都是一篇内容。树冠来自文章里的汉字,大小随内容体量与更新时间变化;金色小径标出最近更新,并直接摘出标题。

2025年3月5日 讨论3 讨论3 的学习笔记,整理相关概念、推导过程与实现要点。 2025年8月24日 大模型强化学习(PPO)代码实现 大模型强化学习(PPO)代码实现 一、前置知识与训练阶段概述 大模型训练三阶段:预训练 → 监督微调(SFT)→ 强化学习(PPO),视频聚焦第三阶段 强化学习前提:需... 2 2026年4月22日 π0.7 深度解读:从"数据清洗"走向"上下文引导"的范式转变 感觉pi模型进步神速啊,前段时间short memory才没过去多久(我们都还在训练),结果又推出了一个新的。 2025年8月15日 OCL论文精读 OCL论文精读 模型架构 实现细节 OCL can be depicted as $P(\alpha I)$ and $P(\beta I,\alpha)$. In $... 2025年3月6日 链表 元素的地址:元素的首地址(因为一个元素可能是多个字节) 比如int类型(4个字节) a1 :0,1,2,3 a2:4,5,6,7 随机读取 $ O(1)$ a[i 1]... 2025年3月16日 讨论4 讨论4 的学习笔记,整理相关概念、推导过程与实现要点。 2025年9月2日 《强化学习的数学原理》第2课-贝尔曼公式(知识点整理 《强化学习的数学原理》第2课 贝尔曼公式(知识点整理 Return的核心作用:策略评估的量化工具 (一)Return概念复习 定义:某条轨迹上所有奖励的“折扣总和”,公... 2025年4月2日 CNNArchiture CNNArchiture 的学习笔记,整理相关概念、推导过程与实现要点。 2025年9月2日 Overall Map Overall Map Chapter 1: Basic Concepts Concepts: state,action,reward,return,episode,p... 2025年3月16日 makemoreMLP makemoreMLP 的学习笔记,整理相关概念、推导过程与实现要点。 2025年3月12日 micrograd micrograd 的学习笔记,整理相关概念、推导过程与实现要点。 2025年8月6日 Pickle Pickle pickle实际上是一个字典,并且可以多层嵌套。 2025年8月24日 MissNODAG: Missing Value Noisy DAG Discovery MissNODAG: Missing Value Noisy DAG Discovery 概述 MissNODAG是一种能够处理缺失值和噪声的因果发现算法。 2025年8月24日 Llava论文: Visual Instruction Tuning Llava论文: Visual Instruction Tuning Architecture Use GPT4 to generate dataset with VQ... 2025年3月19日 hyperparameters 训练语料:莎士比亚文选 含有Decoder的Transformer,利用自注意力机制。 2025年10月10日 手撕KMeans & Kmeans++ 手撕KMeans & Kmeans++ KMeans原理 K Means是最经典的聚类算法之一,其核心思想是通过迭代过程,将数据集划分为K个簇,使得每个数据点都属于离它... 2025年3月16日 makemore makemore 的学习笔记,整理相关概念、推导过程与实现要点。 2025年8月24日 Loss Function Loss Function PositiveBCELoss PositiveBCELoss 是一种 二元交叉熵损失(Binary Cross Entropy Loss... 2025年3月17日 makemoreNinja 为什么在计算方差的时候,我们要使用/(n 1)而不是/n? 2025年8月24日 CELLO: Causal Evaluation of Large Vision-Language Models CELLO: Causal Evaluation of Large Vision Language Models Dataser Construction Pipeli... 2025年8月24日 DAG-GNN: Directed Acyclic Graph - Graph Neural Network DAG GNN: Directed Acyclic Graph Graph Neural Network 概述 DAG GNN是一种基于图神经网络的因果发现算法,由Zh... 2025年8月24日 NOTEARS: Nonlinear Structural Equations with Alternative Regularization and Sparsity NOTEARS: Nonlinear Structural Equations with Alternative Regularization and Sparsity... 2026年1月29日 写给天七的一封情书 写给天七的一封情书 这封情书,我已静静酝酿了两年。 2025年8月24日 Representation 视频中围绕线性结构因果模型和因果表征学习,涉及多个核心数学公式的推导,以下结合视频内容详细拆解: 一、线性结构因果模型(SCM)的基础公式 1. 潜在变量的线性表示 视... 2025年7月27日 Pandas库 Pandas库 Series:带标签的一维数组 Series 类似于 NumPy 的一维数组,但有索引(标签)。 2025年8月24日 Towards Causal Reprensentation Learning Towards Causal Reprensentation Learning 知乎解读1 知乎解读2 微信公众号解读 在论文中, 独立因果机制(ICM)原则 和 稀疏... 2025年3月5日 问题概述 问题概述 假设某人感染 COVID,记为事件$C$, $A$:“核酸检测结果为阳性”,$B$:“抗原检测呈阳性”。 2026年1月29日 杂谈 在大学里,每次有人问我从哪里来的时候,我总会下意识的回复“成都”。 8 2026年4月20日 变化 变化 记录一下我和Claude的讨论 Q: 所以说人到底是什么时候长大的呢? 2025年8月24日 Peter-Clark (PC) Algorithm Peter Clark (PC) Algorithm 概述 PC算法是一种基于约束的因果发现算法,通过条件独立性检验来学习因果结构。 2025年3月6日 Back Propagation Back Propagation: Simple Example:$f(x,y,z)=(x+y)z$ 1.Forward Pass: Compute outputs f... 2025年11月24日 高中回忆录 待完成...... 2025.03.14记 高中真的很美好,那种青涩纯洁的恋爱一生中再难遇上一次。 2025年2月28日 Multiclass SVM Loss: Linear Classification: $f(x i,W) = W \cdot x$ Matrix multiply: stretch x to a one di... 2025年10月10日 t-SNE t SNE 参考文献:《t SNE 入门:非线性降维与数据可视化 DataCamp》 Introduction to t SNE: Nonlinear Dimensio... 2025年8月6日 Logging Logging 默认输出:日志等级+日志名称+日志内容 参考 Logging format: https://docs.python.org/3/library/log... 2025年8月24日 Triplet Loss Triplet Loss 如上图所示,Triplet Loss 是有一个三元组<a, p, n 构成,其中 a: anchor 表示训练样本。 2025年7月27日 Pythonic Pythonic 原来我可以少些这么多For Loop List Comprehension: lst = [i for i in range(100)] Genera... 2025年8月18日 torch.einsum torch.einsum torch.einsum(equation, operands) → Tensor Einsum 可以通过基于爱因斯坦求和约定法的简写格式来计... 2025年3月1日 A1 Deep Learning $\in$ Machine Learning Deep Learning $\cap$ Computer Vision = EECS 498... 2026年1月29日 Hachi 本来是那种看到开头就知道结尾的剧情,但还是止不住眼泪。 2025年4月25日 One time setup One time setup Activation functions Don’t use sigmoid or tanh because it will make g... 2025年8月24日 torch.addmm torch.addmm $out = \beta \times mat + \alpha \times (mat1 @ mat2)$ 换句话说,就是需要传入5个参数,m... 9 2026年4月10日 港澳手记 港澳手记 香港的城市质地确实不一般,但给我一种割裂感。 2026年4月10日 永不停歇的嘀嗒:香港行人信号灯,一座城市的心跳 永不停歇的嘀嗒:香港行人信号灯,一座城市的心跳 香港的行人过街提示音——这道急促而执着的电子脉冲,在1106平方公里的土地上,约2000个路口昼夜回响——早已超越了交通... 2025年8月24日 Structural Causal Model Structural Causal Model Known Model Known Variables Policy Evaluation ✅ ✅ Structure... 2025年10月10日 睡眠的重要性 把之前所有在脑子里预演的稿子梳理一下 我一直认为睡眠是极其重要的,甚至是最重要的。 2025年3月17日 makemoreComnet makemoreComnet 的学习笔记,整理相关概念、推导过程与实现要点。 2025年8月24日 ALCM: Autonomous LLM-Augmented Causal Discovery Framework ALCM: Autonomous LLM Augmented Causal Discovery Framework Conventional data driven c... 2025年3月4日 SVM: SVM: ​ $W:(D,C)$ $X:(N,D)$ $y:(N,)$ 注:1. (N,)表示一维向量,既不是行向量也不是列向量。 2025年9月2日 贝尔曼公式(强化学习)核心知识点总结 贝尔曼公式(强化学习)核心知识点总结 一、贝尔曼公式基础认知 1. 核心定义 :描述不同状态的 状态价值(State Value,记为 $v \pi(s)$) 之间的关... 2026年1月29日 3 Idiots All is well. 今天晚上花了三个小时看电影,给我看爽了。 2026年1月5日 图算法 检测从某点出发是否会碰到环 用“颜色法”(递归DFS) 检测从某点出发是否会碰到负环 在该点的连通分量上使用(len(reachable) 1)次Bellman For... 2025年8月24日 torch.where torch.where 1. 基本语法 condition :布尔条件( torch.BoolTensor ),决定选择 x 还是 y 。 2025年4月11日 Optimization $w^ = \arg \min wL(w)$ Idea 1 :Random Search(Bad Idea! 2026年1月5日 测试示例 1 直接调用sort函数,注意key的选择 如果想要对两个或者多个层面进行排序,比如说一个二维数组 [[1,2],[3,4]] ,可以把key设成tuple形式,比如说 k... 2025年3月16日 makemoreActivation makemoreActivation 的学习笔记,整理相关概念、推导过程与实现要点。 6 2026年4月20日 2026寒假三城游 2026寒假三城游 1.20 上午抵达武汉天河国际机场,打车去酒店。 2025年9月3日 Pseudocode Pseudocode Value Iteration Policy Iteration 2025年3月20日 Problems with RNN(among others) useful reference: PPT Problems with RNN(among others) RNN: Recurrent Neural Network... 2025年10月10日 Python Basic Knowledge Python Basic Knowledge [:: 1] When an object is indexable,we can use a[:: 1], 1 mean... 2025年4月2日 CNN Convolution Layer Without padding: Feature maps shrink with each layer. Input: W Fil... 2026年3月21日 J属性大爆发! 我发现我特别喜欢做旅游攻略,虽说不上擅长,但是真的很热爱。 2025年3月1日 Neural Network Linear Classifiers cannot deal with non linear boundaries. such as two circles with... 2025年3月22日 diveintogpt diveintogpt 的学习笔记,整理相关概念、推导过程与实现要点。 7 2026年4月20日 大伟哥分享(语音整理版) 大伟哥分享(语音整理版) 第一部分:我的本科与研究生经历 我的人生观、世界观确实打开了很大的世界。 2025年4月25日 我们到底应该如何理解BatchNorm和LayerNorm? 我们到底应该如何理解BatchNorm和LayerNorm? 2025年9月3日 第3课-贝尔曼最优公式(最优策略和公式推导)知识点整理 第3课 贝尔曼最优公式(最优策略和公式推导)知识点整理 一、最优策略的定义与核心问题 1. 策略优劣的比较标准 若存在两个策略$\pi 1$和$\pi 2$,对于 所有... 1 2026年5月21日 日本游记 日本游记 旅途中的语音备忘(m4a),点击播放。 2025年8月14日 mAP mAP 的学习笔记,整理相关概念、推导过程与实现要点。 2025年9月2日 《强化学习的数学原理》第1课-基本概念知识点整理 《强化学习的数学原理》第1课 基本概念知识点整理 核心实例:网格世界(grid world) 1. 世界构成:由网格组成,包含3类网格 可进入区域(白色):机器人可正常... 2025年8月24日 PPO算法原理 PPO算法原理 一、强化学习基础概念 1. 核心要素 (以超级玛丽游戏为例) Environment(环境) :游戏本身(画面、后台程序),负责状态转换、奖励生成等 A... 2026年1月5日 测试 区间DP 枚举长度,然后找到中间分裂点,再进行枚举。 2025年10月10日 二倍速 二倍速 的随笔,记录经历、观察与当时的思考。 2025年7月15日 Latex学习 Latex学习 的学习笔记,整理相关概念、推导过程与实现要点。 2026年1月3日 翻转对 (Reverse Pairs) 翻转对 (Reverse Pairs) 的学习笔记,整理相关概念、推导过程与实现要点。 2025年8月14日 Cosine Similarity Cosine Similarity 1. 基本概念 余弦相似度(Cosine Similarity)通过计算两个向量的夹角余弦值来衡量它们的相似性,常用于文本、图像等向... 2025年8月6日 Regex Regex 核心概念:原始字符串 (Raw Strings) 在定义正则表达式模式时,强烈建议使用 Python 的 原始字符串 ,即在字符串前加上 r 。 2026年3月24日 河狸变身计划影评 河狸变身计划影评 昨天下午看了《河狸变身计划》,我上午还给lzh调侃说我只会去影院看动画片,结果在猫眼一看,上一部一个人去看的是哆啦A梦,在之前是野猪公主,反正基本上都... 2025年3月5日 Derivative of Matrix 一元微积分中的导数与微分的关系: $df = f'(x)dx$ 多元微积分中的梯度(列向量)与微分的关系: $df = \sum {i=1}^n \frac{\part... 2025年3月6日 2-layer-network 4. 用线性代数的知识证明 \( L \) 对 \( W1 \)、\( W2 \)、\( b1 \)、\( b2 \) 的梯度 为了证明损失函数 \( L \) 对权重... 2025年8月24日 Leaning Causal Structure Distributions for Robust Learning Leaning Causal Structure Distributions for Robust Learning During learning we instan... 2025年8月6日 🧭 TensorBoard 全面学习路线 🧭 TensorBoard 全面学习路线 我们会分模块进行讲解,每个模块包括: 📘 功能介绍 🧪 代码示例 🔍 TensorBoard 页面展示 🧠 典型应用... 2025年7月27日 Pyplot Pyplot 绘制x和y点 plot() 函数默认从点到点绘制一条直线,参数1是包含x轴上的点的数组,参数2是包含y轴上的点的数组。 2026年1月29日 为什么要叫绿色大门呢? 我刚看了《蓝色大门》这部电影,上学期期末以及最近一直在听《黄色大门》,我觉得二者是有很多共同之处的。 5 2026年4月20日 AI与人 AI与人 的随笔,记录经历、观察与当时的思考。 2025年10月10日 Write A Professional Docstring Write A Professional Docstring Google Style Docstring Numpy Style Docstring 2026年1月29日 冬至 冬至 的随笔,记录经历、观察与当时的思考。 2025年4月4日 Canny Edge Detector Canny Edge Detector 图像灰度化 读取图像(plt/cv2读的都是BGR) 转换为RGB格式 任一点灰度值可以用平均法 / 权重计算 Gray(i,j... 3 2026年4月22日 DreamCatch AI DreamCatch AI 掬梦 基于多模态AI的梦境捕捉与重建系统 Product Proposal v1.0 2026.04.19 一款专为梦境记录者设计的AI工具... 4 2026年4月22日 DreamCup Stage1 DreamCup Stage1 目前已经把项目demo搓出来了,效果还可以。 2025年4月4日 Hough Line Transform Hough Line Transform 数学原理 类似极坐标(但不是极坐标),在直角坐标系中,用$r,\theta$表示直角坐标系的$(x,y)$ $y = kx +...