ELE-yufo

都在背 π=3.14，但没人告诉你它到底是干嘛的

2025-11-27 0:31

|

187

|

0

|

闲聊

2473 字

|

10 分钟

我经常跟身边的朋友做一个看起来挺无聊的测试。大家坐在一起聊天的时候，我突然问一句：“咱们都知道π是多少吧？” 这招百试百灵，绝大多数人都能顺口接一句：“3.1415926……” 我又接着问：“那 sin30 度等于多少？” 这一样是送分题，大家条件反射地就能回答0.5或者1/2。气氛烘托到这儿，我抛出了第三个问题： “那你们谁能用人话跟我解释一…

窄门之外

2025-11-16 23:19

|

3,202

|

0

|

闲聊

7972 字

|

30 分钟

Ólafur Arnalds - Gleypa Okkur(吞噬我们) 我花了两个晚上读完《窄门》。合上书的那一刻，有种说不出的难受。不是那种读完一个好故事的满足感，而是一种被什么东西击中后的茫然。像是看着两个人慢慢走向悬崖，你什么都做不了，只能眼睁睁看着他们坠落。这种感觉在之后的几天里一直没有散去。我开始意识到，这本书给我的后劲，远远超过了阅…

DeepSeek V3.2 EXP 稀疏注意力机制详解

2025-10-01 2:15

|

992

|

0

|

大语言模型,机器学习

2226 字

|

9 分钟

昨天DeepSeek发布了V3.2-Exp，API价格直接减少75%。看了下论文，核心改进是一个叫DSA（DeepSeek Sparse Attention）的机制。花了点时间研究，记录一下。问题背景先说说为什么需要这个东西。 Transformer的attention机制有个老大难问题：就是O(L²)的复杂度，计算量随序列长度平方增长。具体来…

航拍津城

2025-9-17 22:05

|

149

|

0

|

相册

10 字

|

几秒读完

设备：DJI FLIP 后期：Luminar Neo

沉默的共谋——关于《Cytus II》的一些观察

2025-9-12 18:59

|

451

|

0

|

未分类

6467 字

|

24 分钟

我曾像一个隐身的观众，默念着舞台上每一个角色的名字。直到灯光亮起，照亮全场时才发现，我的座位，就在舞台之上。通关Cytus II已经四年了。我以为那段旅程已经结束。但每次看到那个界面，听着熟悉的旋律响起，依然会有些说不出的感觉。一个音乐游戏，在我心里待了四年。这让我觉得有些不对劲。不是说游戏不好。恰恰相反，它太好了。好到我需要弄清楚，它是如何…

BeatMatcher —— BeatSaber谱面下载器

2025-9-08 2:08

|

357

|

0

|

未分类

276 字

|

2 分钟

好久不打歌了，最近又开始打BeatSaber了，为了方便获取自定义谱面，就做了一个工具，可以根据你自己的音乐路径，自动去BeatSaver爬取对应的谱面。用法很简单，例如 D:\Music 路径是你自己的音乐文件夹，E:\BeatSaber谱面是你的谱面文件夹，下载项目、安装依赖后，执行`python main.py --music-dir "…

「AI Cinematic Guofeng」孤山雨

2025-9-05 23:08

|

173

|

0

|

未分类

34 字

|

几秒读完

虽然民乐里面二胡最常和扬琴一起出场，但在我心里，最配二胡的还是钢琴

「AI民乐」酌君

2025-9-05 22:20

|

190

|

0

|

未分类

24 字

|

几秒读完

动君金屈卮，满酌不须降。花发多风雨，人生足别离。

算法视角下的人工智能历史演进及其数学原理剖析

2025-6-07 10:39

|

2,680

|

0

|

机器学习,深度学习,闲聊

30503 字

|

1.9 小时

引言：算法视角下的人工智能发展脉络人工智能 (Artificial Intelligence, AI) 作为一门致力于模拟、延伸乃至扩展人类智能的学科，其核心目标始终围绕着如何让机器展现出类似人类的思考、学习和决策能力。在AI波澜壮阔的发展历程中，算法扮演了至关重要的角色。它们不仅是理论思想的载体，更是将抽象智能概念转化为具体可执行指令、实现智能…

DeepSeek R1 深度剖析：从 MoE 架构、原生 CoT，到大规模强化学习与蒸馏

2025-1-28 18:55

|

8,870

|

0

|

大语言模型,机器学习

5634 字

|

22 分钟

1. 引言与背景在近两年，大语言模型领域的更新迭代速度令人瞩目，从各种 GPT 系列、Claude 系列到开源的 LLaMa、Qwen 以及 DeepSeek 系列等纷纷崭露头角。一个核心趋势在于：当我们需要让模型不仅“通晓”各类文本信息，而且能做多步逻辑推理、数学推导、编程验证时，传统的纯文本/对话式训练往往不足以覆盖深层次的推理能力；于是…