Pytorch安装教程（包含对齐cuda、cudnn版本，VSCode中Anaconda的设置）

Posted on 2021-08-19 In 学习 , 工具用法指南

Pytorch安装教程（包含对齐cuda、cudnn版本，VSCode中Anaconda的设置）

安装一个编程环境/编程库的过程是无比烦人的。安装环境时不可避免地涉及一些和该环境有关的知识，而配环境的人多半是新手，面对未知的知识时总会碰到许多麻烦。比如第一次配和C++有关的库的时候，新手就不知道.dll应该加入环境变量，.h应该加入include。而在写教程的时候，也一般都是新手在写教程，老手们对配环境这一“简单”的事情不屑一顾。因此，我们一般只能在网上看到新手写的配环境教程，上面都是按部就班地介绍一步一步的操作，讲不出每一步操作为什么要这样做，那些操作可以更改或者跳过，碰到了问题又怎么样。教程的不详细同样是配编程环境令人感到烦人的原因。

基于上述情况，配编程环境考察的是人利用搜索引擎的能力。在配环境时，应该多参考几篇文章，有英文阅读能力的应该去参考官方给的配置教程。出了问题把问题的出错信息放到搜索引擎上去查。一般多踩几次坑，多花点时间，环境总能配好。

也正是基于这些原因，我觉得写一篇环境配置的文章很没有意思。没有技术性和原创性、繁琐而无趣。但恰逢我第三次配置pytorch环境，一切都轻车熟路了。我准备在等待文件下载安装之余截几张图，水一篇文章。

准备

去搜索引擎搜索pytorch安装你的操作系统。比如我这次是在win10上安装，就选择输入”pytorch 安装 win10”.当然，一般会用到Anaconda来安装python上的一些库。在搜索中加入”anaconda”关键字可以搜到更多的教程。

当然，官方网站上也已经给出了不少信息了：https://pytorch.org/get-started/locally/

我的博客是随手写的，看这篇文章可能解决不了所有问题。正如前言中所说，应该多参考几篇教程。

安装Anaconda

Anaconda可以让用户更好地管理python包，配置pytorch需要先安装Anaconda。我说不出它的优点，反正大家都在用，我也一直在用。

https://www.anaconda.com/products/individual#Downloads 这里可以下载Anaconda

如果使用的是Windows，安装以后，点击任务栏中的搜索框，搜索Anaconda，打开Anaconda Powershell Prompt (Anaconda)或者Anaconda Prompt (Anaconda)。Ubuntu貌似进入命令行进入了Anaconda。

在conda命令行中输入conda create --name env_name python=3.7

env_name是虚拟环境的名字。装Python库，就好像在一个新房子里放家具一样，时间久了东西越来越乱。Anaconda给了你无限创造新房子的机会。你可以在一个完全没有“家具”，甚至连Python都没有的虚拟环境里，重新配置库文件。env_name就是虚拟环境的名字，我一般命名为pt，这样输入起来很快。后面的python=3.7是可选的，python版本可选，这句话加不加也可选。没加的话晚点安装python也行。

创建完环境之后，输入conda activate pt就可以进入新的虚拟环境。前面的(base)应该会变为(pt)

搞成上图那样就算配得差不多了。

CPU版本的Pytorch

Pytorch等深度学习框架分CPU版和GPU版。GPU版速度快，但装起来有点复杂。如果只想稍微学习一下编程框架，以后用GPU服务器跑正式代码，可以只装CPU版。

这个时候，为了避免GPU版教程的干扰，应该在搜索引擎中搜索Pytorch CPU 你的操作系统

一般输入conda install pytorch-cpu torchvision-cpu -c pytorch就可以安装好了。但这个时候，一般有一个坑会碰到：下载速度奇慢无比。

这个时候，应该去网上搜索conda 下载慢类似的关键字。网上一般会给出以下几个办法：换源、直接下载安装包、用pip下载。源就是下载的来源网站，在国内的话最好切换到国内的下载网站比较快。我选择换conda源的方法下载。明确了方法后，要继续换搜索的关键字，应搜索conda 换源。我搜索到的办法是：输入conda config --set show_channel_urls yes。之后在用户根目录(比如C:\Users\Yifan Zhou)下编辑.condarc，加入以下内容：

channels:
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
  - https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
ssl_verify: true

我发现换了源还是下载得很慢，于是直接挂了个VPN再下载（哈哈哈）

比较好的方式开始用换了源的pip

下好之后稍微验证以下。比如安装之后，继续在Anaconda的虚拟环境中输入以下内容

1
2
3

python
import torch
print(torch.__verion__)

GPU版本的Pytorch

确认显卡驱动

在安装GPU版本Pytorch之前，还要保证电脑中有版本正确的cuda和cudnn。cuda是一套GPU上的编程库，cudnn是基于cuda的深度学习库。Pytorch依赖这两个库，而cudnn版本依赖cuda版本。而由于cuda貌似更新比Pytorch快，出于向下兼容的考虑，应该先在电脑支持的CUDA版本和Pytorch支持的CUDA版本中选择一个较小者，再下载该版本的CUDA和CUDNN。

但是，在安装这些东西之前，还可能碰到一个坑——显卡没装驱动。这里默认电脑使用的是N卡。在控制台中输入nvidia-smi，如果出现了类似下面这种信息：

就说明驱动已经安装好了。如果没有，请搜索显卡驱动，适当加入”Nvidia Cuda Cudnn pytorch tensorflow python”等关键词，多看几篇教程总能把驱动装好。

输出信息中的CUDA Version就是电脑显卡最高支持的CUDA版本。到网上下CUDA也应该不超过这个版本。

CUDA

记录下nvidia-smi命令输出的CUDA版本（比如我的是11.1），再在 https://pytorch.org/get-started/previous-versions/ 查Pytorch是否支持该CUDA版本。如果不支持，就选一个网站上有，且版本小于命令输出的CUDA版本的。之后去 https://developer.nvidia.com/cuda-toolkit-archive 找到合适的CUDA版本，选择版本后选择自己对应的操作系统。下载了可执行文件后直接运行安装。

CUDNN

打开 https://developer.nvidia.com/rdp/cudnn-archive 这个网站。注册账号并登录。根据CUDA版本，找到合适版本在合适操作系统下的CUDNN。（注意是下载cuDNN Library，比如[cuDNN Library for Windows10 (x86)]）

正如前面所描述的，CUDNN是个库，不需要安装，只需要把其文件复制到CUDA文件夹下即可使用。要把CUDNN中的bin，include，lib都复制到CUDA的对应目录下。

注意，CUDA的bin文件夹应该被添加进环境变量。用默认设置安装CUDA时一般该文件夹会自动被加入环境变量。

Pytorch

在 https://pytorch.org/get-started/locally/ 中，选择合适的操作系统和CUDA版本。参考CPU版本的Pytorch这一小节的内容，用conda一键下好pytorch。如果网速慢，请利用搜索引擎解决问题。

一切都下载完后，在环境中输入以下内容，看到True就是胜利。

python
import torch
import torchvision
torch.cuda.is_available()

风雨夜行记 ~ Adventure in a Rainy Night

Posted on 2021-08-05 In 杂谈 , 记叙文

风雨夜行记 ~ Adventure in a Rainy Night

初到上海，老天爷就隆重地请来嘉宾”烟花“迎接我的到来。一场突如其来的台风席卷了城市，大雨倾盆而下，把人们关在了家中，连多家知名餐馆都停止了外卖服务。傍晚，我在生活用品尚不齐全的新房间里，摸着空空如也的肚子暗自叹息。怎么办？是吃点零食，全身脏兮兮地回床上避难？还是一往无前，出门购买食物和所需的生活用品？向来喜欢追求成果上限的我自然是选择后者。

出门之前，我先在脑子里进行了任务计划。我的主要目标是吃饭，次要目标是购买生活物品。既然出了门，就要吃得好一点，并且去大超市买东西。我的住处附近恰好有一个大商场，附近必然有不错的餐馆。我在地图上看好了路线，背上用于运货的书包，带上心爱的遮阳挡雨两用自动伞，就头也不回地出门了。

刚一出门，我就意识到了今晚行动的困难性。屋外风雨交加，骤雨把漆黑的天空和昏暗的街道融为一体，雨点落地声甚至盖过了地铁启动时的轰鸣。今天晚上，我的行动恐怕和在RPG里做主线任务一样充满挑战吧。

果不其然，我很快就碰到了第一道关卡。在我的住处和大马路之间，有一条必经的小道。小道没什么人维护，平日里看起来幽雅宁静，下雨时还因积水形成了一条小溪，真多亏了它糟糕的排水系统。我把第一个场景命名为”积水巷道“。在积水巷道上，电动车驾驶员都得小心翼翼地行驶着，生怕把水溅到身体上，我一个撑着伞的行人又该怎么通过呢？我倒是不慌，想着：凡是游戏里的关卡，必然设置了通关的方法。很幸运，我发现路对面有一条较窄的人行道，上面没有积水，可以安稳地通过这条小道。想来这条路的建设者并不是没有注意到路面会有积水的现象，还非常贴心地建了一条下雨专用人行道。看得出这个建设者以前应该是个程序员，碰到解决不了的BUG，就给用户另一个更复杂的操作步骤来绕过BUG。凭借着细心的观察和对程序员的理解，我顺利利用人行道离开了积水巷道关卡。

离开了小道，来到大马路上，我立刻见识到了台风的威力。本来几阵夹杂细雨的微风就让我撑伞撑得十分吃力了，忽然的一阵狂风让雨伞飞舞起来，整个伞面都翻转了过去。不仅是我，街上其他撑伞的行人都受到了不小的影响。只见几个行人万般无奈地收起了伞，在雨点的敲打下叹息着。我碰到了新的挑战：“狂风事件”。狂风事件会在行动时随机发生，令行人失去撑伞能力，被迫淋雨，降低行动能力与士气。如果不是有不得不去做的事情，一般人遇到狂风事件都会退缩，立马跑回家去了。然而，我却十分冷静地面对着突然刮起的大风，使用我独创的“相对论遮风挡雨法”消除了狂风事件对我的影响。

什么是“相对论遮风挡雨法”呢？这里就要介绍一下背景信息了。之前出去旅游的时候，一向不喜欢撑伞的我，被太阳晒得没办法，买了现在这把遮阳挡雨两用自动伞。我发现遮阳的时候如果和遮雨一样正着撑伞，有的时候遮阳效果并不好，因为太阳的光往往是斜着照过来的。然而，不管你人朝着哪个方向走路，都把伞正对着太阳，就能起到非常好的遮阳效果。因此，我独创了一种“相对论遮阳法”，根据太阳的方位，在走路的时候固定手和伞的朝向，而不管自己朝着哪个方向走。今天碰到了台风后，我瞬间领悟了“相对论遮风挡雨法”，以应对狂风事件。这种撑伞法相比之下更加复杂，需要分两个步骤进行。在第一步中，需要用手无力地把伞举起，通过伞的运动方向感受风的方向；在第二步中，用类似相对论遮阳法的手法，把撑伞朝向固定为风吹来的方向。凭借这种方法，无论风有多大，只要握紧伞把，伞就不会翻转，还能把雨滴全部挡下来。使用相对论遮风挡雨法后，我自由自在地在风雨中走着。

由于我肚子实在太饿，我决定改变计划，立刻吃饭。马路对面有几家店还开着，我满怀期待地过了马路，希望能找到一家合适的餐馆。结果这边还在开门的只有几家装修平庸、看上去就不靠谱的餐馆，剩下还在开门的店就只有日式便利店、药店，还有一家写着“内有被褥”的杂货便利店。这些店都不能解决我的饮食问题。我有些低落地向前走了几步，突然眼前一亮，看到一家装修精美的餐厅。原来是一家看起来质量还不错的咖啡馆。但是这种店又过于正式了一些，不适合一个人随便解决一餐。一个人吃顿饭还是有些难啊，这样的店就适合几个人一起去，尤其是情侣。情侣？哼！这种店就是为了提供这样的氛围才装修得这么好的，太不为单身的人考虑了。一想到这，我就气饱了，也不管肚子饿不饿了，义愤填膺地从店门口晃了过去。

又走了一段时间，我发现店面越来越少，路也越来越窄，最后竟被一棵吹倒的大树拦住了去路。这感觉不对啊，是不是走错了路？我破天荒地打开手机看了下地图，反复确认了我走的路是正确的。这棵树是怎么回事？我很快给了自己一个合理的答案：RPG游戏里经常会出现第一次能走通的路在游戏后期被拦住的情况，玩家需要进入一个新的场景，通过更难的关卡，来绕过障碍物。想到这里，我就摩拳擦掌，对即将面临的新事件期待起来：我是不是要自己找一条路出来？结果，我又看了一眼地图，发现地图导航提示我在此处应下台阶。我这才发现，这条路本来就是死路，我应该走地下通道绕过这里。我刚刚提起的兴致一下就被浇灭了。

终于，商场的大楼近在眼前了，我只需要过一条比较宽的马路就行了。可是，我又碰到了新挑战：马路上有不浅的积水，穿凉鞋倒是可以不管不顾地走过去，可我穿了运动鞋出来。看来我不得不面对这“无伤通过积水公路”的挑战了。细心的我发现斑马线是有一定厚度的，踩着斑马线走几乎不会沾到水。绿灯一亮，我就使出”轻功水上漂”绝技，大踏步地踩着斑马线走。最后一条斑马线离人行道还有一段距离，这之间还有不少积水。为了保证自己是“无伤通关”，我一扭头，令积水恰好能反射路灯的灯光。这样，我就掌握了所有的危险地带和安全地带的位置。踏过几个较干的路面，我成功抵达了马路对面。

地图上显示商场的关门是十点，而现在是八点多，时间还算充裕。我看商场对面开着的店铺很多，决定先找个地方吃饭。有好几家店看起来都不错，该去哪一家呢？正当我准备开始分析时，突然发现一个外卖员从一家面馆走了出来。能做外卖，这个点还有人点餐，说明这家店应该还不错。特别是我发现这家店里还有一个正在用餐的人，这让我对这家店的质量更加放心了。进店之后，我直接点了最贵的红烧牛肉面。面端上来用了七、八分钟，这对饥肠辘辘的我来说就像45分钟的语文课一样漫长。加几滴醋，用筷子微微搅拌，捞出一大把筋道的面条，配上大块牛肉，我享受这绝妙的用餐体验。一想到吃一辈子红烧牛肉方便面也吃不到这么多牛肉，我就吃得更香了。我吃得过于投入，以至于身上的雨水渐渐变成了汗水。吃完面条，我没有休息，立刻走出店门，吹了下风才发现身上出汗了。

马上，我的旅途就要抵达终点了。在明亮的商场里挑选商品，而不必四处躲雨，这就是我即将获得的通关奖励。买完东西之后，我还要打出租车回家，结束这冒险之旅。一边想着这些幸福的事情，我很快来走到了商场门口。商场里面倒确实是十分明亮，可大门却是锁着的。十点没到，商场怎么关门了呢？看来今天台风的影响确实很大，出于人道主义的考虑，商场的工作人员都早早下班避雨了。这么大的雨，也没人来买东西，商场也赚不到钱啊。想到商场关门的种种原因，我顿时觉得自己十分草率，竟然出门之前不去从商场的角度考虑，忽视了商场有提早关门的可能。但也不亏，我的主要任务——吃饭已经完成，买生活用品的支线任务就放一边吧。站在商场前的路灯下，我偶然抬头一望，针状的雨在光线下清晰可见，猛烈地扎在我伞上。看见无色的雨本身算是一件有趣的事，现在的我却只能感叹今天雨真大。

忽然，我发现自己似乎错过了什么东西。购买生活用品这一任务还不能宣告失败！我又再次充满了动力，沿回家的路走去。

回程时，我走在马路的另一侧。非常烦人，我又碰到了新的挑战：马路这侧的人行道中间的路砖因修地铁而全部挖掉了，人行道外的马路又全是积水，马路上时不时有汽车经过，走马路中间也不太好。我唯一的选择，就是走人行道外侧残留的石砖。石砖非常狭窄，仅能恰好放下我的鞋子。石砖的一边是积水的马路，一边是坑坑洼洼的泥土——还好不是掉下去就死的万丈深渊，起码给我留了一些容错率。于是，我开始挑战“平衡木”关卡了。虽然我天生缺乏运动细胞，但我使用了极佳的前进策略：我一只手使用相对论遮风挡雨法撑伞，为了平衡，另一手略微向外伸出。我出乎意料地顺利通过了平衡木挑战，虽然中间有几次失去平衡踩到了泥土上。

路过“倾倒之树“景点，我再次感叹起了今天行程的不易。仔细想来，今天好像遇到了不少有趣的挑战。于是，我一边走路，一边构思起了这篇文章。

走到了”积水巷道“的入口，我没有进去，而是又过了一次马路，走到了那一排仅有少数亮光的店面前。原来，在发现大商场关门后，我的潜意识一直没有停止思考，一直寻找着购买生活物品的方法。那时，我忽然想起这里有一家便利店写着”内有被褥“。为什么一家便利店要在牌子写这些东西？是真的提示顾客里面卖被子吗？不是这样的，真相只有一个！其实”内有被褥“的意思是，这家店不仅是一个卖饮料零食的普通便利店，还是一个卖生活用品的杂货店！！虽然我没有进店确认，但我利用心理学思考推理出了这一结论。有了这一发现，我才满怀希望地踏上了回程的路，觉得宣告任务失败还为时尚早。

那么结果如何呢？我走进杂货便利店一看，果然，在被子旁边，还有洗衣液、碗筷、垃圾桶这些生活用品，甚至还有电饭锅。我的推理完全正确！我最近一直在看柯南，感觉学到的推理能力一直没有用武之地。但非常巧，今天恰好有一个舞台，让我把推理能力淋漓尽致地展现了出来。不仅是看柯南学到的推理能力，我在之前参与的很多项目、经历中已经掌握了极强的逻辑思考和求解问题的推理能力，并且在玩LOL时锻炼了从对手的角度反向思考的”千层饼“心理分析能力。今天我把这些能力都用了出来，实在值得吹嘘一番。

考虑到台风可能一时半会儿不会走，我不仅把日常要用的清洁用品买了，还买了个电饭锅准备回去自己做东西吃，买了一大堆东西。最后，我一只手撑伞和拎锅，另一只手抱着刚买的装得满满当当的垃圾桶，吃力地走出了杂货店。虽然拎这么多东西很麻烦，但我看着这些”战利品“，感到十分充实与开心。

雨势渐小，积水巷道里的水却依然没有消退。和出来的时候不同，我熟练地走上了人行道，回忆起了今天的奇遇。今天我的行动称不上旅行，用”冒险“来形容恐怕更恰当一些。正如我以前写道的，旅行的意义在于旅行的体验。其实今天吃饭、买东西的任务都在其次，最令我难忘的是一路的见闻、经历。虽说老天不是很给面子，让台风来迎接我的到来，但也多亏了这风雨交加的夜晚，给了我这独一无二的体验。这换成其他任何人，或者其他任何时候，都很难有这样的情况出现吧。再往大了想，人生的快乐也不是那么奢侈的事情。都说”偷得浮生半日闲“，再平淡的生活，亦或是再艰苦的生活，也是能通过一些方法找到乐趣的吧。

满载着战利品，我回到了家中。今天采取了这么多应对下雨的策略，应该取得了不错的效果。结果我一坐下，屁股一凉，才发现我的短袖裤子和短袖T恤都湿了，鞋子也湿了个透心凉。不能说我的撑伞法、过街法不好，只能说雨下得太大，要挑战的难度太大。今天我的主要任务和次要任务都完成了，虽然没有做到无伤，但也是不小的成就了。今天过得非常好，希望以后我在自我挑战中能够再接再厉。

初夏，一片绿叶悄然飘落

Posted on 2021-08-01 In 杂谈 , 散文

初夏，一片绿叶悄然飘落

一片绿叶

六月，北京的气温开始升高。风和日丽的春天突然离去，闷热的空气充斥了整栋宿舍楼。傍晚，热气依然没有离开宿舍的意思，我只好先它一步，跑到宿舍外散步乘凉。

散步时无事可做，我只好欣赏起校园里那些不起眼的花草树木起来。经历了漫漫长冬后，在第一阵春风的引导下，植物开始竞相生长。大树又一次长满了树叶，和草坪一起，构成了一幅放眼望去只有绿色的单调画面。好在有各色的花朵在路旁点缀，给枯燥的以理工科为主的大学勉强增添上了一分色彩。

经历了一个春天的滋补，初夏的植物都茂盛地生长着。我偶然低头看去，突然发现树下竟然有几片落叶。与秋天落木萧萧的美景不同，此时地上的落叶只有零星的几片，树上也看不到有任何树叶要落下的迹象。想必这几片落叶只是不成器的失败者，看它们枯黄的颜色就知道，和正在生长的绿叶相比，它们并没有得到足够的养分，最后体力不支被风吹到地上。

忽然，一阵风吹过，又一片树叶从树上落下。我的内心一阵欣喜，因为自己的猜想算是得到了证明：哪怕在夏天，依然会有些发育不良的树叶被吹落。但我定睛一看，却又是一阵震惊：树叶从大树深处的阴影中落下，却在灯光下显得绿得发亮；明明是从高处跌落，最终必将驻留在地上，却在风中迟迟不肯落地。

这片落叶是与众不同的吧。和地上那些已经一动不动，几近腐烂的落叶相比，它绿得那么鲜艳，在空中飞舞得那么轻盈。明明马上就会落地，失去活动的机会，却依然奋力地展示着自己的生命力。

和树上那些长得正旺的树叶相比，它也是不同的。它本来应该可以继续在树上生长，用最好的姿态去迎接盛夏的骄阳的吧。那它是不小心从树上跌落，还是自己想离开大树的呢？它是见惯了花开花落，厌恶了大多数植物同样的命运？还是只是想随风飘摇，看一看树外不同的景色？它最好的归宿是哪里呢？

还未等那片绿叶落地，又刮起了一阵更强的风。眨眼间，绿叶就从我的视野里消失了。我想，大自然已经给了我最好的答案：那片绿叶心向远方。我的视野之外，就是它最好的去处。

迷茫与挣扎

说来丢人，马上就要毕业了，我还没有一个明确的去向。

过去的一年半里，我都是在同样一种不安的心情下度过的。我没有踏上迈向未来的“正轨”，我担心自己的未来会陷入迷茫、找不到方向的境地。事实上，到了即将毕业的今天，我的一切担忧变成了现实。

在这种担忧之下，我很难完全集中于眼前的事情，无论它是否会对我的未来产生功利的影响。我在各种事情上犯了很多错误，或者说有很多做得不好的地方。这些错误或失误长久地驻留在我的脑中，自责不断地刺痛着我，让我在做类似事情回忆起这些错误时都倍加折磨。在正反馈调节下，自责引发进一步的错误，事情向越来越糟糕的方向发展。

我很早就意识到了我的所有问题的原因，并尝试去解决。我通过一系列思考分析清了自己的现状，一直保持着十分自信的心态。但是，我只是发现了问题并分析了问题，却没有解决问题，并付出行动。

我一直在迷茫中挣扎，明白了自责不是解决错误的方法。只有从错误中学习，并提取经验为未来服务，才是利用错误的最好方法。在找寻未来方向的这段经历中，我学到了什么呢？经过一段时间的发现和思考，我得到了这样的结论：人生本身就是混沌的，需要自己去寻找方向。我能找到大致的方向，却缺乏主动为方向铺路并沿着道路前进的能力。

温室里的流水线

两年半前，我参加了某个留学中介的讲座。主讲人提到了一个案例：有一个计算机专业的学生，大学前三年都对专业知识一窍不通，但是在大三暑假依然找到了一个和艺术、信息技术相关的暑研，最后大四申请到了该方向上的硕士。主讲人想通过这个例子说明，留学中介可以极大地帮助想留学的同学，哪怕专业能力再差，也能申请到学校。主讲人把这个故事当成了宣传中介的绝佳示例，却让我彻底断绝了向留学中介寻求哪怕一丁点帮助的想法：一个这样的人都能成功留学，那这种形式的留学的意义在哪，又有何含金量可言呢？这样是“没有意义”的。我宁可自己申请不到学校，也不想通过留学中介“成功”申请到某所学校。

我一直坚持着自己的观念，由于种种原因我也确实没有申请到学校。一开始，我还没有相同自己潜意识里想表达的“没有意义”是什么意思。现在，我总算想通了自己申请留学的意义所在：出国留学，是对自己未来的一次主动选择。这其中有许多信息、方向上的困难，而不是思考、智力上的困难。这个过程考验人对于方向的掌握，并为某个方向努力的能力。留学中介帮你完成了许多中间步骤，让你失去了这次锻炼自己掌控自己未来的机会。将来，或许是留学毕业后，肯定还会再次碰到未来方向的选择问题。侥幸绕开了一次考验，只会把问题全部积攒起来滞留到下一次考验上。因此，当时的我就在潜意识中认识到了：选择未来，掌控未来是一种重要的能力，比能否在毕业那年成功留学重要得多。我要利用这次机会主动选择未来的方向并朝着方向迈进。

我在一所还不错的大学里上学。仔细回想，我和周围的人一样，从小到大不过是在温室里的流水线上，在他人的呵护下推动着移动罢了。绝大多数出生普通的孩子都被灌输“万般皆下品，唯有读书高”的信念，巴不得鲤鱼跃龙门，一朝金榜题名改变命运。我和周围这些幸运的同学，在家长和老师的照料下，十二年考场厮杀搏斗，千军万马中闯到名牌大学。我们人生的轨迹是早早地就决定好了的，人生的价值甚至是可以被量化的：用那光彩照人，却又污秽不堪的考试成绩来表示。考试越来越难，周围的人越来越强，流水线上的人越来越少，我们嬉笑地看着跌落出流水线的人，暗自骄傲。

到了大学，父母的呵护少了些，世界那狰狞的本性逐渐向我们展露出来。我们慢慢离开了温室，却依然没有离开流水线，而是逐渐被机器划分到了不同的支流上。有的支流叫做“保研”，有的叫“出国”，还有叫“工作”、“考研”和“创业”什么的。有人会跟你说，每条支流上的风景都很好，有哪些优秀的零件获得了许多奖项，保持着顶尖的成绩，收获了“精彩”的人生。大家趋之若鹜，纷纷在流水线上赛跑着，继续争夺着那几条看起来更体面的支流。

但是，人生绝对不是只有铺好的道路，或是说那些自动运行的流水线的。人生的大部分地方是混沌、黑暗、未经探索而充满危险的。在混沌中前行，会迷茫、犹豫；会陷入深坑，难以挣脱；会因害怕和痛苦而回头逃避；会因找不到同行的人而寂寞惆怅；会对着无人的夜空哀嚎。但是，正是在无人探索的深处，有光明，有宝藏，有能让你忘却路上所有的苦难，并且骄傲地向全世界炫耀的事物。危险而困难，却充满了令人向往的事物，这才是人生的全貌。流水线，只是人生的一隅，一个被前人故意建好的设施而已。

每个人在人生中的某个阶段，总会走下这流水线，被迫去用自己的双脚探索这个世界。亦或是流水线的终点已到，仅需在附近寻找光照，就可以停滞不前却又安稳地生活着；亦或是从某处落下，无法立刻安定，在担惊受怕地瞎逛一阵后，建立起一个勉强供自己生活的根据地；亦或是凭自己的意志离开，不断前行，根据自己脑中的印象，去寻找世界上最危险、最美丽的宝藏。

正是意识到了这些，我对流水线积怨已久。我想凭自己的双脚走路，却又对远处的黑暗感到恐惧，只好暂且跟随有光照的流水线行走。我畅想有一天能逐渐远离流水线，去往更有趣的地方。但十分不巧，一座高山出现了。我的面前是一座垂直的悬崖，高不见顶，给人高山仰止之感。我屡次伸手想借突出的石块攀岩上去，却又屡屡跌落。摔伤的次数越多，我越恐惧，离下次尝试的时间就越久。我看到附近有不少人登上了山：有人乘着流水线，缓缓上了山；有人沿着铺好的、略有陡峭的台阶，很快跑上了山；哪怕是荒凉的周围，也有人攀登上了较矮的山峰，踏上了登山之旅。我开始责问自己为什么没有长得更高一点，手脚为什么没有更有力气一点，上次攀登的时候为什么没有再小心一点。最终，我开始驻足不前。

在温室的流水线里呆久了，我不过是一个大号的婴儿而已。凭借叛逆的本能，逃离了流水线，却发现自己根本没有掌握足够的运动能力。不肯低下头，看着路前行；倒下后，不肯治疗伤口，躺着逃避下一次挑战；不肯向周围张望，挪动双脚，换一条上山的道路。周围的一切都看得清清楚楚，却就是因为种种原因毫无行动。

现在，我不仅看清了周围，还看清了自己。既然向往远处的宝藏，那么再高的山、再陡的崖也无法阻止的我前行。体能不行，就去锻炼身体；一个石块被我抓断了，就去抓旁边那块；跌倒了，就尽快投入下一次尝试。凭借着正确的战略，征服眼前的山只是时间问题。

后记

在外面转了一圈后，我不仅身上凉快了，脑子也清醒了，回宿舍后立刻把所见所想记录了下来。

我又想起那片树叶了。它的颜色那么鲜艳，不是春风赏赐给它的，而是它从树的枝干里汲取营养，自己长出来的。既然它心向远方，哪怕暂时落到地上无法移动，风儿或许也会因欣赏它的美丽而响应它的呼唤，载着它继续飞翔。

人在前进时需要动力，谨以此文自勉。

真·后记

写完这篇文章后，我觉得内容有些羞耻，就立刻把文档关掉，再也没打开过。一个多月后重读这篇文章，还是觉得内容有点不太适合发表出来。不过仔细分析了一下后，我觉得这篇文章里并没有过多地反映我个人的信息，而是很好地刻画了一个人的心理活动，并且表达出了一些思想，对于他人来说还是有一些阅读价值的。照相记录画面，录音记录声音，那么文字则是能把思想、情感保存下来，供愿意欣赏的人品味。我最终还是准备把这篇文章发表出来。

如今我已经有了毕业的去向。我不会嘲笑自己之前的焦虑，毕竟这些都是宝贵的人生体验；我也不会因有了去处就得意忘形，因为这本来就是我应得的。这件事其实不是本文的重点。最重要的是文章中提及的对人生的态度，即如何决定自己未来的发展。不论何时，我都会坚持这样的态度。

“悬梁刺股”不如“乐此不疲”

Posted on 2021-06-19 In 杂谈 , 议论文

“悬梁刺股”不如“乐此不疲”

正文

大学四年中，我有了许多新的感悟。其中，我认为最重要的一项收获是：与其“悬梁刺股”般督促自己艰苦地奋斗，不如在任务中寻找令自己快乐的成分，从而乐此不疲地达成目标。我在大学中印象最深刻的两段经历印证了这一道理。

一、因为热爱，所以成功

第一段经历是我在大一暑假参加的算法竞赛集训。当时，我有幸受到了学长学姐的邀请，提前加入了集训队。我既要和其他大一同学一样，学习新的竞赛知识，又要和其他高年级集训队的同学一起参加模拟赛。作为大一的学生，我要每两天上一次课，每次完成数十道习题；作为集训队的一员，我每周要参加四场训练赛，每场比赛持续五小时，赛后还需要回顾比赛中没写出来的题目。在旁人眼中，我每天都要完成大量的题目，日子过得十分辛苦。然而，我自己知道，我从小就不是一个刻苦的人。我之所以能每天坚持写完那么多题目，是因为我乐在其中。当我思路深陷泥潭，绞尽脑汁也想不出解题之道时，屏幕上一行行的“答案错误”就仿佛是对我的付出所发出的一声声嘲笑；而当我柳暗花明，总算把题目解出来时，屏幕上那一行“答案正确”就是对我最好的盛赞。这句对我的赞美，胜过了之前所受的所有嘲笑，让我收获到了极大的成就感。我享受学习新算法时的恍然大悟，享受想题时的冥思苦想，享受解题失败后的心烦意乱，享受解题时的灵光一闪，享受题目最终通过时的开怀大笑。我热爱算法竞赛的一切。

正是因为我对算法竞赛的这份热爱，让我不知不觉中完成了大量的习题，竞赛水平突飞猛进。在暑假集训前，由于我在高中没有竞赛基础，我的水平在同年级中算不上拔尖。而集训结束后，我的水平得到了质的飞跃，在大大小小的比赛中都取得了不错的成绩。暑假结束后，在程序实践课的期末考试中，所有同学要求组队在两个小时里完成五道题目。我单人参赛，50分钟不到就以全年级最快速度写完了所有题目。之后，我首次参加正式的算法比赛，我们团队获得了银牌。一个月后，我参加国际大学生程序设计竞赛亚洲区域赛。凭借着我通过的一道中等难度的题目，我们队伍拿下了北理2018年第一块算法竞赛金牌。

我在算法竞赛中获得的金牌，为我带来了许多利益上的收获。但是，在参与算法竞赛中最令我难忘的经历，不是登上金牌领奖台的那一刻，而是我大一暑假集训时，那乐在其中的每一天。我的热爱为我带来了成功，但我不是为了获得成就而去热爱，而只是单纯觉得参加竞赛很有趣而已。在参加算法竞赛的过程中，我不仅每天都过得十分开心，更是学会了一个道理：热爱自己的事业，能够取得成功。

二、抛开压力，寻找目标

第二段经历是我在大三暑假开始参与的研究项目。我和另一位同学一起，在本校明振军老师和与本校有合作关系的Farrokh，Janet教授夫妇的指导下进行科研。两位外国教授不仅学术成果斐然，更是善于教学，他们的许多学生已经成为了教授。现在，这两位教授年事已高，却依旧思路清晰、逻辑缜密，还心胸宽阔，毫无保留地指导着各个国家的学生。他们不仅在科研上指导我们，还常常分享生活和学习的心得。有一次，我们向他们请教，在和同龄人的竞争中感到压力太大怎么办。Farrokh教授回答道：“时常保持快乐。成功的人不一定快乐，但快乐的人总能成功。我喜欢我的事业，我做着我喜欢的事情，别人的成就又与我何干呢？我每天勤恳地工作，是因为我热爱我做的事情啊！”

教授的一番话点醒了我，让我开始重新审视自己的行为。在遇到这两位教授之前，我就已经参与了一些科研项目。但是，我感觉自己付出了很多时间与心血，却一直没有什么收获。回过头来一想，我之前参与科研，只不过是为了发论文，提升自己的背景，获取利益而已。我根本没想清楚为什么要去参与科研，只会关注有没有产出，所以参与科研时感到十分辛苦，却又毫无收获。我根本不喜欢我正在做的事情。

我参与的暑研课题离我的专业比较远，导致我对这个课题并不是很感兴趣。但是，在这次的科研项目中，我开始转换思维，试图去发掘这个科研项目中令我感兴趣、能让我有动力去奋斗的目标。结果，还是两位教授的教诲帮助了我。他们告诉我，科研不一定是要做出什么惊天动地的成就。发掘一些新的知识，能给其他研究者带来启发，这就够了。因此，我确立了我在这次科研中要达到的目标：做为本科生，想做出太大的创新十分困难。不如提出一些简单的创新点，并尽可能给别人的研究提供一些灵感。确立了能让我获得成就感的目标后，我在毫无压力的心态下投入到了这个科研项目中，最终完成了一篇论文，该论文目前正在投稿中。在这段经历中，我并没有像算法竞赛一样那么热爱我正在从事的工作，但我依旧去挖掘任务中能让我感到兴奋、愿意为之奋斗的因素。最终的结果证明，在压力下为了功利匍匐而行，不如看向远方，慷慨高歌着踏步而行。

三、不再“努力”，快乐人生

我的算法竞赛经历，让我明白从事自己所热爱的工作，能够既享受过程，又收获成功。我的暑研经历，让我明白哪怕是面对自己不是很喜欢的事情，艰苦地奋斗依旧比不过为了任务中某个热爱的成分而奋斗。但是，我的收获和大部分人的认知有所出入。从小到大，我们都被灌输了要努力学习的概念，也听过种种因努力而成果的例子。诚然，是有很多人凭借着过人的意志，在艰苦的奋斗后取得了成功，比如“头悬梁，锥刺股”的故事。但是，又有多少人倒在了正在努力的路上呢？我们不得而知。从另一个角度来讲，什么是成功呢？在人生的一站中凭借辛苦的努力取得成功，是否又能在下一站成功呢？什么时候能停下来，欣赏人生的大好风景呢？努力，本来是表示尽力去完成一件事，引申为一种积极的工作态度。然而，在诸多艰苦奋斗事迹的渲染下，努力成了抑制自己的欲望、让自己在一种十分不情愿的态度下，依然拼尽全力去做事的代名词。这种对于“努力”的阐释，完全是自相矛盾的：自己都感到辛苦，说明自己的内心根本不认同自己正在做的事情，那哪里来的动力去把事情做好，取得更高的成就呢？因此，在目前从事的事情中感到辛苦的人，要么是因为无法失败而勉强自己

，把任务以最低的标准达成，要么是为了诸如功名的其他目标而强迫自己奋斗，在达到短期目标后就会立刻抛弃当前这项令自己辛苦的工作。正是因为这种对努力的错误阐释，导致有些人盲目努力，倒在了半路上；有些人通过“努力”获得了一时的成功，却在下一件事情中顺从自己远离压力的本能，放弃了努力；有些人持续地“努力”，一直小有成就，却发现自己的努力是没有尽头的；有些人深谙事故，“努力”一时得到了自己想要的事情后，开始鼓吹“努力”，通过他人的努力获利。不管每个人经历如何、结果如何，这些所谓压制自己的欲望进行艰苦奋斗的人，在“努力”时是不幸福的。

“努力”的反面，是快乐地从事一件事。保持快乐的心态能否取得世俗上的成功，这难以下一个定论。但是，保持这种心态的人，有着其他层面上的优势。这种优势体现在整个人生的意义上。人生的意义是什么呢？简单来讲，就是要让自己过得开心。与“努力”相比，热爱自己所从事的事情，能让人持久地获得动力，同时获得享受。更进一步地，不管当前从事的工作是否热爱，都应该从中寻找一些值得奋斗的目标。人生中，除了成绩、背景、金钱、地位、粉丝、异性缘这些世俗、公认的目标，还有着更多精彩的事物。视频游戏胜利时的一幅画面、沙滩上的一块贝壳、茂密草丛中的一束红花、父母的一声叮咛、久别重逢时的一阵寒暄、对视时躲闪的一缕目光、半夜的一段深思、聚光灯下的一场演讲、求知者抛来的一句提问、万千人幸福的笑脸。这些事物，远比世俗的目标重要得多，更能让人士气高昂地前行。“乐此不疲”的人，不需要在人生的路上休息，因为他们一直是快乐的，更是有意义、无悔的；甚至因为他们对于事情有着更多的投入，反而更容易收获其他人眼中难以企及的成功。

“悬梁刺股”不如“乐此不疲”，这是我从大学中印象最深刻的两段经历中得到的收获。未来，我依然会保持这份信念，在自己热爱的领域中取得令自己满意的成就。“悬梁刺股”不如“乐此不疲”

吐槽与评价

其实，现在我有很多时间了，应该静下心来反思一下，并发一些博文了。我有好多东西想总结，并且表达、分享出来的。可惜自己太懒了。

这篇文章是为了学校最终的德育答辩而写的。正常来说，我随便写一下糊弄过去就完事了。但是，这篇文章可能可以发表到学校的”前辈经验分享“书刊上，供新生阅读。我十分想向别人分享一些想法，尤其是对于比我年轻、可能会重新走我的一些弯路的人。考虑到我的文章可能会帮助别人，甚至改变他人的人生，我决定认真写一篇文章。

写文章之前，我的潜意识里就已经制定了一些写文章的注意事项（我的大脑的思考能力实在太强，以至于我不需要刻意地思考，就已经制定了完成事情的策略）。一些策略是为了能让文章被顺利录用，一些策略是为了更好地帮助后辈们。

立意不能过于反常理。显然，抨击学校的不合理制度、告诉大家在大学不应该做些什么的是不允许发表的。但是，如果写一些常见甚至错误的立意，就对他人没什么帮助，我写起来也没劲。因此，我选择了我演讲时最常用的，有点反常理却能让人接受的一个立意：努力学习不如快乐学习。
让审稿的人知道你很厉害。我必须吹一下我取得的成就，告诉审稿人我很强，这篇文章很有参考性。这是我擅长的领域，我在文章中也花五成功力吹嘘了自己一番。
告诉后辈们一些重要的信息。讲大道理谁都会讲，但我特意在文章中写了一些十分具体的东西。聪明的新生会利用文章中提到的信息来提升自己。

同时，文章的字数要求在3000字左右。为了不让自己受到字数限制的影响，我特意没有用word和其他软件，用了看不见字数的记事本来写这篇文章。可谓是殚精竭虑，面面俱到。

制定完了策略后，我就开始写文章了。一开始，我写得非常不顺利，一方面是因为这是篇正式文章，虽然没有题材要求，但还是不能写起来太奔放的；另一方面，文章要花一些笔墨来写事，我只擅长写理和对事情客观而准确的描述，单纯写事对我来说有点不熟悉。结果文章写完，导入word一看，只有2200多字。没办法，我要说的话就这么多，该怎么办呢？

没办法，我开始顺从本心，在文章的总结阶段加入自己擅长的分析说理的文字，瞬间提升了文章的深度，也让文章从各种意义上看起来不够自然了。写完之后，导入word一看，3000字，刚好。我把想说的话说完了，发到博客上了。最终能不能被学校录用我已经不在意了，我已经把我在这几件事上想说的东西都说出来了，我的目的已经达到了。这篇文章中，我已经对我的这种态度进行了一定的说明。我讨厌无意义的结果，讨厌为了不纯粹的目的花费时间。我的目标是分享有用的经验，我认为这篇文章对后辈有着非常大的帮助。如果因为文章的某些观点不太能够被理解，导致学校不发出来，那我也不愿意去为了迎合审稿人而修改内容。

讲完了我写文章的心路历程，现在来评价一下这篇文章。评价之前吐槽一句，我发现自己的文学素养实在太差了。我有着灵活的思维，天马行空的创意。这不仅仅体现在其他方面，还体现在文学创作上。可惜，我没有足够的文学积累，无法做到用巧妙的方式来表达我的意思。但我清楚地知道，只要我有一定的文学积累，我一定写出具有文学性的文章，即用词优美华丽，却不失内涵，有深意的文字。有时间我会去尝试养成阅读文学书籍的习惯。

文章中前几段描写的是我的两段经历。其中第一段经历确实是我印象最深刻的经历，我也时常与别人分享，两次演讲中都分享了这个经历。第二段经历有点生搬硬凑的感觉，与实际情况有些出入，但为了写文章举例子不得不歪曲了一下真实的情况。这几段没什么出彩的地方，不过没有这些经历的人看完这些经历，应该能体会到一些东西。

后面三段总结段本来是很短的，最后我在放开手脚后往里面加入了很多内容。倒数第三段批判努力的内容我本来想单独用一篇文章来写，从本质上分析原因。可惜我实在太懒了。这篇文章浅谈了努力的部分内容，有一点点深度。当然，写这一段时我非常爽，因为我讽刺了非常多的东西。如果稍微对生活有一些观察，就能看懂这一段具体在讲生活中的哪些现象。

倒数第二段虽然比前一段短，却包含了更多的深意。这里的内容其实已经和本文没关了，应该在另一个主题里提及。但为了让自己写得爽一些，我直接就开始把想写的东西全写了。这一段的内容不知道读起来是不是很奇怪，但内容绝对不是乱写的，而是有逻辑，有一些文字背后的深意的。

总结来看，这篇文章是一篇要提交上去的文章，虽然我认为质量已经足够，但缺点还是很多。文笔不够好，这是自然的。文章后面有点违和，这是由于我为了凑字数，转换了写作思路导致的。评价起任何一种艺术作品来何其容易，但真做起来还是很难的。比如这篇文章，我知道有哪些地方不够好，但就是不好改，甚至我没有能力去改。不管怎么说，我认为这篇文章还算是合格，可以提交上去，也可以发到博客上分享一下。

Poisson Image Editing 论文方法实现

Posted on 2021-05-10 In 记录 , 论文阅读

“Poisson Image Editing”论文方法实现

在上上篇博文中（现在是上上上了），我介绍了一下这篇图像融合的经典论文。今天，我将记录一下这篇论文的C++代码实现。我已经三个多月没碰C++了，手很生。但是，我会凭借着我高超的编程底力和过人的天赋，三小时内完成代码实现。稍微对工作量有一点了解的人都会产生疑问：“你在开玩笑吧？论文实现不比写算法题，你要先去看懂论文，再调一调别人的库函数，写代码之前有很多准备工作要做。你这不可能完成。”肯定有人这样想。但是，我可以说，包括学习前置知识在内，我可以三小时完成实现。这是一个七年编程王者应该有的自信。这篇博文的正文和会按之前的格式对项目的实现做一个比较全面的记录，最后一个章节会写下我完成此项目的实况。

代码仓库：https://github.com/SingleZombie/Gradient-Domain-Image-Processing-Cpp

由于种种原因，在记录了编程的实况后，我就把这篇博文搁置下来了。但马上要写毕业论文了，这篇博文和论文的内容有很多重合之处，我打算先把博文写完。

知识准备

在代码实现前，我们先整理一下实现方法的整体思路，再提取出实现中涉及的知识点，对每个知识点有关的实现方法和具体的实现技术进行介绍，最后对方法的核心——结果图像求解进行一个详细的介绍。

方法思想

整个方法的总流程图如上。和普通的图像复制类似，方法需要输入一幅源图像、一幅目标图像及复制区域（步骤1），输出一幅融合好的图像（步骤4）。为了得到最终的图像，需要先计算出源图像的梯度（步骤2），再根据目标图像在复制区域边缘的像素值和源图像复制区域的梯度值对结果图像求解（步骤3）。实际上，其他步骤都十分简单，方法的关键就在于第三步结果图像求解。

方法中设计的知识点有：

图像输入/输出：这项操作的内容很显然：把操作系统中的图像文件读入到程序的一个数组中，再把一个数组输出成一个图像文件。这个可以通过OpenCV库来轻松实现。图像输入输出是OpenCV最基本的操作，网上随便搜一搜OpenCV的教程就能找到。我自己也有一篇博文讲了这项知识。
图像梯度计算：所谓图像的梯度，就是每个像素与它左边和上边像素的颜色值之差，某处的梯度值表示此处颜色变化速度的快慢。由于后续操作需要源图像的梯度，在实际进行结果图像求解前需要先预处理出图像梯度。实现的时候用一个滤波器对图像做一次滤波即可，OpenCV包括了滤波功能。我的这篇博客简单介绍了OpenCV滤波函数fillter2D的用法。
结果图像求解：图像融合方法的思想是在融合区域边缘的颜色和目标图像一样的前提下，让源图像的梯度尽可能不变。这是一个最优化问题，最后问题可以转换成求解线性方程组。因此，这一步的目的就是通过求解线性方程组来得到我们想要的结果图像。这是本程序最关键、困难的一步，C++的Eigen库提供了高性能的矩阵运算函数。
图像拼接：最后输出前，要把处理过的图像区域和整幅目标图像拼起来。OpenCV提供了方便的图像区域覆盖函数。

本程序设计的图像处理操作都十分基础，用一些简单的OpenCV库函数即可。如前面多次强调的，该程序的关键是第三步。下一节将对第三步进行详细介绍。

结果图像的问题建立与求解

(导向插值标记，来自论文[1])

一般来说，用公式描述一件事是方便描述者，而折磨倾听者的。但是，为了把问题准确无误的描述出来，有时不得不使用严谨的公式标记。

在此问题中，我们把图像看成一个函数。如图所示，$S$是一个二维点的集合，即一堆可以用$(x,y)$这样的坐标描述的点。集合$S$就是图像函数的定义域。图像的值域呢？自然是图像的像素值了，这取决于实际情况，比如RGB像素值的范围是$[0, 2^{24})$。

现在，理解了图像其实可以表达为定义域是二维点，值域是颜色空间的值域的一个函数后，就可以继续理解符号标记了。令$g$是源图像，$f^*$是目标图像，$f$是我们把源图像复制到目标区域后，经过图像融合，得到的结果图像。按上一节的话说，$g$和$f^*$是输入，$f$是输出的结果图像。我们还有一个输入，就是进行图像融合的区域$\Omega$。既然我们把图像看成了函数，那么区域$\Omega$就是整个定义域$S$的一个子集。

$v$是$g$的梯度，$\partial\Omega$是区域$\Omega$的梯度，这两个量都是计算得到的。

我们还要引入一个符号——梯度算子$\triangledown$。$v$是$g$的梯度，可以写成$v=\triangledown g$。

重申一下结果图像求解的思想：在融合区域边缘的颜色和目标图像一样的前提下，让源图像的梯度尽可能不变（最小化差值）。用数学语言就是：

如果理解了求解的思想，那么看懂，或者说推导出这个公式是十分简单的。

这个公式是理想情况：图像在一个连续的二维数集上定义。但实际上，我们图像是离散是，只有在整数的位置处有值。我们要把问题用离散的形式表达出来。这里又要提出一些标记，对于$S$中的每个像素$p$，令 $N_p$ 为其4邻域中仍在 $S$ 的像素集合。也就是说，这个符号表示的某个像素上下左右这四个像素的集合，在这些像素没有跑出整幅图像的前提下。令 $(p,q)$ 为一个像素对，其中 $q \in N_p$ 。

再令 $v_{pq}$ 表示 $pq$ 两点间的像素值之差，即p到q方向的梯度值。则上面那个离散化的式子可以被转换成：

能看懂之前的式子，看懂新的式子也不难。

经过一系列数学推导，上面这个离散域的最优化问题可以被转换成一个线性方程组：

这个方程组就比较难懂了。不过，可以用一个直观的方法描述出来：待求解的结果图像的每个像素与周围四个像素的像素值之差（梯度）的求和等于源图像与周围四个点的像素值之差（梯度）的求和。公式中结果图像的每个像素与周围的梯度的求和分了两部分，是因为如果这个像素来自图像边界，则这个值是指定的（来自约束条件，边界像素值等于目标图像的像素值），在等式右边；如果像素不来自边界，则这个值是未知的，在等式左边。

有了联立的线性方程组，问题就变成了纯粹的数学问题，有很多的工具和方法来求解。

程序实现

程序结构图

在理想情况下，程序的结构图如下：（目前的代码很乱，没有严格按照这个图来）

整体分成输入、输出、和图像处理模块，非常简明。

如方法思想中所介绍的，图像处理可以分成图像梯度计算和目标图像求解。而求解又可以分成方程组建立和方程组求解。

这里仅介绍图像处理模块的实现细节。该模块整体的伪代码如下：

这份伪代码只能算是把整个流程用英文表达出来了而已，前文的梯度计算、方程组建立、方程组求解等内容均有体现。接下来几节介绍这三个重要步骤的细节。其他诸如获取图像的一个区域、填充图形一个区域的操作十分简单，可以用OpenCV轻松实现。OpenCV用Rect表示一个矩形区域，假设其有实例rect。令mat为任意一个图像，则mat[rect]就是图像的一个区域，可以执行读写操作。

图像梯度计算

梯度计算是学数字图像处理时的一个基本作业，由于有库函数的帮助，实现起来很方便，其伪代码如下：

拉普拉斯滤波器就是

1
2
3

[[0, -1, 0],
[-1, 4, -1],
[0, -1, 0]]

这样一个3X3的滤波器。手动建立一个滤波器后，调用OpenCV的filter2D就可以完成滤波了。

方程组建立

问题的方程组就是“结果图像的问题建立与求解”一节中最后一个公式所表示的方程组。只有彻底理解了那个公式中每一项的由来，才能把方程组建好。方程组求解时用到了矩阵，这其实就是把方程组的所有有关参数塞入了一个二维的存储结构中，没有太深奥的东西。

方程组主要有3项：系数矩阵项，边缘像素值项和梯度项。系数矩阵是方程组的左端项，后两者之和就是方程组的右端项。这一步的伪代码如下：

系数矩阵项lhs只由融合区域的大小决定。设矩阵的第i行表示第i个像素有关的方程，则第i列就是表示i像素自己的系数，由公式可知系数值是$|N_p|$；而其他至多4个在这个像素上下左右，且在融合区域内部的像素的系数是$-1$。

边缘像素值来自原问题的限制条件：融合区域的边缘像素值等于目标图像在此处的像素值。因此，这一部分的值要根据目标图像及融合区域得到。由于边缘项的出现没有什么规律，实际实现时可以在计算系数矩阵的同时计算边缘项：对每个像素四周判断，如果这一项在边缘上，则更新返回的边缘项；否则更新系数矩阵。

梯度项则完全来自源图像区域的梯度，甚至每个元素的位置都没有变，只要把它的形状改成列数为1的矩阵。

方程组求解

有了所有参数，调库求解方程组就是几行的事情了。下面是Eigen求解Ax=B方程组的代码：

Eigen::SparseLU<Eigen::SparseMatrix<float>> solver;
solver.analyzePattern(A);
solver.factorize(A);
Eigen::VectorXf tmpRes = solver.solve(b);Eigen::SparseLU<Eigen::SparseMatrix<float>> solver;
solver.analyzePattern(A);
solver.factorize(A);
Eigen::VectorXf tmpRes = solver.solve(b);

我只有在这一部分贴了代码，因为其他步骤都是比较灵活的，每个人都有自己的实现方式。只有这一步调库的写法是固定的。

求解完方程组，程序其实就基本写完了。

UPD：SparseLU并不是求解此问题的最佳方法。SimplicialLDLT适用于正定对称矩阵，在此问题中有更高的性能（我并不知道其中的原因，但是官网上明确写出这个方法适用于2D泊松问题，我就把结论拿来用了，哈哈）。只要把上述代码的SparseLU替换掉即可。

Eigen::SimplicialLDLT<Eigen::SparseMatrix<float>> solver;
solver.analyzePattern(A);
solver.factorize(A);
Eigen::VectorXf tmpRes = solver.solve(b);Eigen::SparseLU<Eigen::SparseMatrix<float>> solver;
solver.analyzePattern(A);
solver.factorize(A);
Eigen::VectorXf tmpRes = solver.solve(b);

结果展示

如图，(a)是源图像，(b)是目标图像，(c)是直接复制的结果，(d)是图像融合的结果。从视觉上来看，图像融合的效果还是不错的。如果能够用套索工具代替方框工具选择区域。用套索工具的话，难点在于实现套索工具本身，这已经脱离了本程序的主要任务了。有了套索的选定区域后，就是获取边缘项烦了一点，大部分的步骤还是一样的。

UPD:

程序里发现了一个BUG！！！方程右端的边缘项应该是相加，我写成了直接赋值。上面的结果图片是错的，正确的图片如下：

后续工作

在下面的”实况记录“一节中，你会发现，我5个小时不到就完成了没有bug的程序，基本完成了整个毕业设计。得知了这一事实，你能得到哪些结论？

首先，你会说：”哇，你好强啊，这么快就把一个看上去那么复杂的项目写完了。“确实，这说得很正确。但这对于我来说是基本操作，甚至我还对自己有些不够满意，写代码的时候急躁了一点，不然可以更快写完。比起学东西，写论文和博客等文档的时间，实际编程的时间确实占比很小。

层次高一点的人，会评论道：”你这项目太水了吧！你干了什么？不久求个线性方程组？高中生都会解这种问题，叫一个大一新生学一学也能写出求解线性方程组的程序。“这说得不错。确实这个项目实现起来很简单。但是，你要注意到，这是一个科研性质的毕业设计。什么是科研？写代码是科研吗？不是。科研是要针对一个问题，提出某些解法，或者说改进现有的解法。重点是思路。我刚刚也说了，我的大多数时间其实花在了看文章、学习上面。这十分合理。

对科研有一点经验的人，又能找到我的漏洞了：”你刚刚说科研的定义，说得很好。但你做了什么呢？你复现了别人的方法。这是科研吗？这有任何创新吗？有任何改进吗？“能说出这种话的人，一定是高手。确实，本文的内容是不太够的。我的创新点在其他地方。这篇文章，只是我毕业设计的核心部分，还有一些内容没有展示出来。敬请期待以后的博客。

真正善于见微知著的人，还能得到其他的结论：”这就是本科教育吗？本科论文就这么水吗？“我只能说：“是的。”本科教育基本没有给学生们提供接触科研的机会，而学校为了方便大家毕业，不会在毕业设计上为难大家。没有了GPA，奖学金这些功利的东西，大家也没有认真做这个项目的理由了。本科毕业设计，就是一个从学校、导师到学生，基本没有人会认真对待的东西，从动机的角度来说，十分合理。

要是你再想得透彻一点，会发现这一切都是不是事。还是我最喜欢强调的，重点是你学到什么，你能得到什么。对于我来说，本科毕设强化了我的科研能力，让我找回了一点写代码的熟练度，锻炼了逻辑表达能力。虽然我花费的很多心思没有任何功利的作用，没有人会注意到我做的那些东西，但我知道我能得到什么就够了，不需要得到别人的认可。本科教育也是这样。本科究竟是为了什么呢？说来可笑，一部分去就业，一部分人继续科研。无论是工业界的知识，还是科研能力，本科一概不教。对于大学来说，能通过高考把优秀的人才招进来，本科设立的意义就已经达到了。既然如此，毕业设计怎么搞不都一样了吗。

实况记录

3.22 18:13

现在，游戏开始。先稍微讲一下我已经做好了哪些准备：我已经建立好了VS项目，导入了之前了OpenCV环境，并成功实现了普通的图像复制。我下好了别人实现论文的代码，以及代码中将用到的Eigen数学库。我还没有学过Eigen的用法，也没有把整个方法的实现流程完全想好。