【收藏夹2020-2021】

时间：2023-08-12

　　Excel 统计前一列重复次数：=COUNTIF(A:A,A7)选中有公式的单元格，键盘按住shift，选中需要填充公式的最后一个单元格，选中需要填充公式的整列后，按ctrl+D,即可填充整列公式； Excel处理数据有坑

　　https://www.zhihu.com/question/20096750

　　在这里插入图片描述 windows离线安装Pytorch

　　找到官网的地址https://download.pytorch.org/whl/torch_stable.html

　　找到对应的文件，我是python3.7，安装cpu版本的

　　pip install XXX 【还原论、数学知识、背景插值】

　　这种还原论思想，可以说是近现代科学的一个“元命题”。不这么假设，一切科学原理的数学表述，都无从下手，也不可能展开。所谓数学的语言，所谓方程式，就是建立在这些假设的基础之上。

　　还原论思想的第一点来自古希腊哲学传统中的“物质无限可分”，即相信可以通过无限切分物质，获得关于物质的精确知识；并且这种切分不损害知识本身（这一点与东方“相生相克，循环往复”的整体观知识假设完全不同）。

　　第二点是一些貌似处理不确定性的科学知识，比如概率统计，需要假设“每个个体都是独立的”，彼此之间既不相互干扰，也没有个体差异（大家都一模一样）。假如不是这样，绝大多数统计规律就都不好使了。

　　严格说，在一个流动的世界里，你的一眨眼工夫，这个世界已经发生了悄然的变化。表面上看，你似乎感知到这个世界连续的景象，其实这种心理上的“连续性”，是被你的背景知识“插值处理”过的。

　　换个角度说“状态的涌现”，“涌现”这个词所对应的还原论科学的术语，叫作“构造”。在还原论科学里面，状态是可以构造的，可以刻画的。

　　如果简单概括成一句话，我愿意说复杂性最重要的特点，就是“局部无法推知整体”。但是，从局部推知整体，恰恰是我们主流的认识论、实践论最重要的特征。

　　不是有一句话，叫作“你要想知道梨子的滋味，你就要亲口尝一尝”吗？这既是实践论，也是认识论。对不对呢？我说它“几乎”是对的。“几乎”，就是说大体上这么说没啥毛病，但细想之后会有问题。因为就算你尝了“这一个”梨子的味道，你也未必知道“那一个”梨子的味道。所以我们说局部最终没有办法推知整体。认为局部可以推知整体，其实是“假设系统”出了问题。你要假设所有的梨子都一个味道，假设所有的“舌头”的味蕾都是一样的，假设所有尝梨子的人都能够用同样的语言表达自己的感受，并且还得假设这种表达是毫无障碍的，如此等等。这样做假设的方式，就是典型的还原性的方式。 NahimicSvc64.exe逻辑炸弹导致CPU直飚99%【已解决】

　　有网友反应电脑巨卡，什么都操作不了，打开任务管理器后，发现多个NahimicSvc64.exe程序占用CPU过高，导致CPU100%怎么办？。NahimicSvc64.exe / NahimicSvc32.exe是微软的纳美音效驱动，可以考虑禁用。

　　【解决办法】：

　　此电脑”->“管理”->“计算机管理”->“服务和应用程序”后->“服务”->找到 Nahimic Service 服务->把启动类型改为：手动或者禁用；

　　最后用管理员身份启动cmd，输入下列命令，删除电脑中所有正在运行的进程：

　　taskkill /F /im NahimicSvc64.exe gephi 中文标签乱码

　　需要把字体改为“宋体”

　　sum(corpus, []) Python tensorflow报错

　　（1）AttributeError: module ‘tensorflow‘ has no attribute ‘placeholder‘解决办法

　　将： tf.placeholder

　　改为：tf.compat.v1.placeholder

　　（2）module ‘tensorflow’ has no attribute 'random_uniform’解决办法

　　将：tf.random_uniform

　　改为：tf.random.uniform

　　（3）module ‘tensorflow’ has no attribute ‘truncated_normal’ 解决办法

　　将：tf.truncated_normal

　　改为：tf.random.truncated_normal

　　（4）module ‘tensorflow._api.v2.train’ has no attribute ‘AdamOptimizer’ 解决办法

　　将：tf.train.AdamOptimizer

　　改为：tf.optimizers.Adam

　　（5）minimize() missing 1 required positional argument: ‘var_list’

　　需要指定w和b：optimizer = tf.optimizers.SGD(name=‘SGD’).minimize(cost,var_list=[W,b])

　　（6） is required when a loss is passed.

　　需要指定tape：tf.optimizers.SGD(name=‘SGD’).minimize(cost,var_list=[W,b],tape=tf.GradientTape()) 在win10环境部署bert，client端一直运行，且无输出

　　我在跑一个程序时，出现了这行代码。

　　from bert_serving.client import BertClient

　　查看一些博客，只通过cmd输入两行安装代码：

　　在这里插入图片描述

　　代码没有错误，可以运行，但是一直不出现结果。我最开始以为是数据太大，运行时间过长。但是我把单行代码逐一测试，发现无法出结果。

　　在这里插入图片描述

　　解决办法:

　　1:安装了Tensorflow环境（我一直以为这个论文程序是pytorch版本，没想到这两行代码是需要tensorflow的环境。也有一个收获就是pytorh和tensorflow也可以在同一个环境中使用）

　　2：https://blog.csdn.net/w417950004/article/details/99080193

　　按照这个博客的步骤去做，就可以了。

　　原文链接：https://blog.csdn.net/zhaoluwei/article/details/109343477 bert_serving报错

　　运行：from bert_serving.client import BertClient

　　报错：ModuleNotFoundError: No module named ‘bert_serving.client’

　　解决：

　　先前我们不知道z的shape属性是多少，但是想让z变成只有一列，行数不知道多少，通过`z.reshape(-1,1)，Numpy自动计算出有16行，新的数组shape属性为(16, 1)，与原来的(4, 4)配套。正则匹配RT @

　　（1）正则表达式[w.]表示什么意思？

　　答：w 匹配字母或数字或下划线， [ ] 匹配中括号里的任意一个字符，合在一起就是匹配任意一个字母数字下划线或 “.”。

　　（2）正则表达式b表示什么意思？

　　答：b代表字与字中间那个看不见的东西，如 here is a word 那么，这句中有好几个b，每个单词的前后都有一个b。

　　B就是反过来，代表非字间。类似d代表数字， D代表非数字。

　　（3）字符 ^ 和 $ 同时使用时，表示精确匹配（字符串与模式一样）

　　例如：^bucket$，只匹配字符串 “bucket”。

　　（4）如果一个模式不包括 ^ 和 $，那么它与任何包含该模式的字符串匹配。

　　参考：https://www.runoob.com/regexp/regexp-rule.html

　　（5）RegexString中，最好指定Advance=1，采用C#正则表达式格式

　　RegexString(Text,Rule,[Advance],[Index]) 参数说明：Text指待处理的字符串文本。Rule指正在表达式，支持常用的正则表达式，为了简化操作，可使用诸如“数字”、“字母”、“小写字母”、“大写字母”、“汉字”等名词代替正则表达式。Advance指正则表达式Rule的书写模式，默认是0，表示使用简单模式，如果设置成1表示高级模式，即Rule是C#正则表达式，比如匹配数字应书写成([d]{0,})。Index指多个结果时返回全部还是指定的结果，可选参数，默认0，返回全部，1表示返回第一个结果。 Pandas读写容易忘

　　DataFrame转list：df.values.tolist()

　　DataFrame转numpy数组：np.array(df)

　　pandas读csv：pd.read_csv(file, sep=’,’)

　　pandas写csv：df.to_csv(file, index=False) 【记录】

　　关注技术进步与落后 vs 关注人的主体性

　　需要密集劳动 vs 需要思考和调查

　　样本差异最大化

　　对理论有所回应用EXCEL绘制甘特图

　　https://www.ixigua.com/6800710859178902027?fromvsogou=1&utm_source=sogou_duanshipin&utm_medium=sogou_referral&utm_campaign=cooperation&wid_try=1 词云绘制

　　数据挖掘实战：Twitter情感分析

　　https://zhuanlan.zhihu.com/p/51758566

　　wordcloud 词云关键字重复多次

　　问题代码如下：

　　与collocations参数有关，默认collocations=True，会统计搭配词。比如你的text是“我在拜访客户”，当collocations为True时，就会把“拜访客户”也当作一个词进行统计，所以会出现重复。

　　wcd=WordCloud(font_path=‘simsun.ttc’, collocations=False，width=900,height=400,background_color=‘white’,max_words=100,scale=1.5).generate(text) 英文标点

　　结果：向量化后的并行运算速度要比普通的执行速度快很多

　　speed_times:2.7337491512298584

　　speed_times:9.00490427017212

　　excluded选项可以指定排除序列化的参数：

　　或者采用指定位置的方式排除:

　　vpolyval.excluded.add(0) vpolyval([1, 2, 3], x=[0, 1])

　　#　输出：array([3, 6])

　　独立级联模型&线性阈值模型：https://blog.csdn.net/qq_34328980/article/details/107712550

　　在这里插入图片描述

　　独立级联模型（知乎）：https://zhuanlan.zhihu.com/p/164608949

　　在这里插入图片描述 word打字输入时卡顿有延迟?

　　https://www.zhihu.com/question/433858568 网络分析工具

　　NodeXL（Excel插件）：https://www.jzwcom.com/jzw/c0/12306.html python datetime,字符串,时间戳相互转换

　　Pandas 取消第一列作为索引

　　pandas.read_csv 参数 index_col

　　index_col : int or sequence or False, default None

　　在默认index_col=None时，pandas会自动将第一列作为索引，并额外添加一列。

　　在使用index_col=0时，直接将第一列作为索引，不额外添加列。

　　可以设定index_col=False 来使得pandas不使用第一列作为行索引。 Python导入自定义模块

　　from … import module_name：导入本模块上一级目录的模块。

　　from …package_name import module_name。导入本模块上一级目录下的包中的模块。需要搞清楚的Python概念

　　语法装饰器

　　闭包关键词共现/属性共现矩阵

　　第一步：Python构建关键词共现矩阵（https://blog.csdn.net/alanconstantinelau/article/details/69258443）

　　第二步：python构建关键词共现矩阵速度优化

　　（https://blog.csdn.net/qklwdd6/article/details/79148582）

　　第三步：Python构建关键词共现/属性共现矩阵

　　（https://blog.csdn.net/alanconstantinelau/article/details/69258443）

　　把几个词归为一个属性，这样构造的属性共现矩阵就可以大大减少矩阵中数目为0的部分，而且会增大共现次数。

　　在这里插入图片描述 python爬取百度时出现，百度安全验证，解决方法

　　解决办法（在请求头中添加accept即可）

　　在这里插入图片描述

　　参考：https://blog.csdn.net/cute_boy_/article/details/106125023 soup.find()和soup.find_all()

　　soup.find和soup.find_all中的参数是一样的。不相信可以在pycharm中，按住ctrl单击我们的soup.find函数，然后我们会看到这样一个定义：

　　其实内部调用的就是find_all，然后取的是第一个元素。

　　另对于此类型的标签元素，我们不能使用，因为class是定义一个类的关键字，而此关键字是不能作为参数的。

　　原文链接：https://blog.csdn.net/qq_26460841/article/details/87867293 用Python对自己的文章做文本分析

　　（1）得到每一篇文章的关键词；

　　用Python计算每篇文章每个词的tf-idf值，需要先对每个文本进行分词，对每个词需要遍历所有的文本的所有词，工作量比较大。硬上的话，代码效率估计会比较低。但是！在看jieba算法的时候，惊奇的发现jieba算法已经内嵌有TF-IDF算法（当然也有TextRank算法），不用造轮子的感觉很舒服，核心代码如下。

　　（2）使用这些关键词生成所有文本的关键词共现网络。

　　关键词共现网络构造的关键是构造共词矩阵。在已经得到每一篇文章的关键词后，假如不考虑每个词的连接强度的计算方法，共词矩阵的构造非常简单，只需要将所有关键词提取出来，将每两个关键词共同出现的次数分别计算出来形成矩阵即可。

　　在完成共词矩阵的构造后，绘图部分同样使用Python实现，所幸在Python中也有前人做好了轮子。使用的是networkx。

　　链接：https://www.jianshu.com/p/1f6ff76a8abb 查询数据库表的列注释

　　查看所有表注释：

　　查看所有表和字段注释（代码中的a和b不用改）：

　　查看某表所有列注释：

　　或

　　（对表的meta data的查询需要使用information_schema.tables， table_schema是数据库的名称，table_name是具体的表名，table_type指的是表的类型）直接获取网页编码并赋给r.encoding

　　chardet检测字符串/文件编码模块，chardet.detect()返回字典

　　import requests

　　r=requests.get(‘http://www.baidu.com’)

　　r.encoding=chardet.detect(r.content)[‘encoding’]

　　print r.text #这样输出的文本不会有乱码查看Python包的安装位置

　　module.file reportLab的单位

　　from reportlab.lib.units import cm, inch, mm, pica, toLength

　　print(cm) # 28.346456692913385

　　print(inch) # 72.0

　　print(mm) # 2.834645669291339

　　print(pica) # 12.0，派卡的意思

　　1像素=0.026458厘米

　　1厘米=28像素只言片语

　　很多时候别人表达出来的意思和你领会到的意思可能完全不同，在许多情况下，我们需要反复沟通才能确认对方的意思。

　　成功并不是由于脑海里堆砌的大道理，而是由于其掌握处理各种实际矛盾的能力。一个普通家庭的孩子，即便自己始终奋进，也需要很长时间才能掌握这些技巧，因此他们的成功往往需要时间的积累。 python字典按值排序输出

　　y=sorted(d.items(),key=lambda x:x[1],reverse=False)

　　注：reverse默认等于False，从小到大排序。等于True时，从大到小排序。正则表达式匹配特定汉字开头与结尾的词语

　　比如一段话中存在“省教育厅，市教育局，省公安厅，省卫健委，省贸促会，省办公厅”等单位，如何用正则表达式匹配？开头为“省”或“市”，结尾为“厅”“局”“办”“办公室”“委”“委员会”等。

　　正则表达式中的括号：

　　中括号[]表示匹配内部任一单个字符；

　　小括号()表示匹配字符或字符串组；

　　大括号{}一般表示匹配的长度；

　　注意：小括号本身不匹配任何东西，也不限制匹配任何东西，只是把括号内的内容作为同一个表达式来处理。中括号表示匹配的字符在[]中，并且只能出现一次，并且特殊字符写在[]会被当成普通字符来匹配。

　　在方括号[ ]中，除了^，-，一切特殊符号全部失效。你的[^abc.?.zip]这个正则表达式，实际意思是，匹配除了a,b,c,.,,?,z,i,p之外的一切字符 “b”：匹配单词边界

　　单词边界：是指空格或标点符号

　　" hello?" 这个左右2侧都有边界

　　" world0" 这个表示左侧有边界，右侧没有边界正则匹配除特定字符外的所有字符

　　＃匹配除空格外的所有字符：S、[^s] 匹配HashTag

　　上述表达式有问题，没有排除井号。

　　上述表达式还是有问题，只检索出第一个hashtag，没有获取到后面的。

　　上述表达式能输出正确结果，即所有的hashtag。**原因是^必须从字符串开头开始匹配，$必须匹配字符串结尾，而不能匹配字符串中间的某个子字符串。**具体见下面案例：

　　多加了一个开头符“^”，结果就只输出一个：

　　在这里插入图片描述什么是分布式新闻？

　　1、分布式是借用的计算机的术语, 是从“分布式计算”来的。

　　2、社交媒体的应用，使得新闻生产逐步趋向分布式，即多种主体在自组织模式下共同参与某一个话题的报道。

　　3、人工智能等技术将进一步推动分布式新闻生产的普及，甚至分布式生产的参与者将扩展到物体。

　　4、在分布式新闻这样的模式中，各种主体的资源发现和整合，报道任务的分配与报道过程的协同，是发展的核心。

　　分布式新闻意味着新闻生产进一步去中心化。专业媒体索然仍然不可取代，但是并非唯一决定性力量。

　　注：分布式系统属于一种软件系统,并且内聚性以及透明性较强,其中的内聚性指所有的数据库分布都拥有自己专门的管理系统,其中的透明性主要是针对用户而言,所有的数据库分布都能保证自己的透明性。分布式系统并没有统一的定义,分布式软件是进行具体的分布式处理的一种有效软件,通过网络互联执行各种任务,其中包括操作系统、程序设计、文件系统以及数据库系统等。

　　作者：Thunder

　　链接：https://www.zhihu.com/question/27233184/answer/279469881

　　分布式新闻是指多种主体共同参与报道。随着互联网的发展，节点化传播兴起，每个人都是庞大互联网上的一个传播节点，也是生产信息的自媒体。在信息爆炸的时代，专业媒体往往不能发布新闻事件的全貌，这时候自媒体们各显神通，发布自己所知的信息进行补充，这就是早期的分布式新闻。等等等等，怎么有点策展新闻、液态新闻业内味儿了？其实网络传播时代，传播的核心就是你一句，我一句，大家一起来嘛～花样千千万，但话语平权的核心不会变！如今，随着传感器、无人机等新技术的普及，人不再成为分布式新闻的唯一参与者，物体也能参与其中，分布式新闻会整合专业媒体、自媒体以及传感器新技术等多重资源，共同进行报道。比如此次疫情期间，乡村无人机喊话，丁香医生更新疫情地图等，这些技术都是分布式新闻的参与主体。当然，因为参与主体的广泛和稂莠不齐，分布式新闻在实际应用中很可能产生假新闻、媒介暴力等各种媒介伦理失范现象。但总的来说，分布式新闻促进了新闻生产的去中心化，多元主体的参与也能帮助一个新闻多角度展现，这一概念也可以和彭兰教授的“节点化生存”一起使用哦～

　　作者：夏日之阳的马甲

　　链接：https://www.zhihu.com/question/27233184/answer/1411402936 大数据分析常用工具

　　在这里插入图片描述 MOOC视频存放在哪？

　　第一：手机中国大学慕课下载课程高清视频完成。

　　第二：打开【本地文件】选项找到【android】系统文件夹进入。

　　第三：在【android】系统文件下点击【data】数据文件夹。

　　第四：在数据文件夹下点击【com.neatease.edu.ucmooc】-【files】。

　　第五：在慕课文件夹下点击【xcache】找到离线缓存文件。

　　第六：打开离线文件夹找到【下载的视频】完成。

　　下载视频可以调节清晰度

　　超萌新级的Python学习心得——字体颜色：https://zhuanlan.zhihu.com/p/51328543

　　性能工具之linux三剑客awk、grep、sed 食谱

　　荤菜：酸菜鱼（草鱼）、肉末豆角（四季豆）、重庆辣子鸡（家里有鸡肉）

　　素菜：干炸蘑菇（白蘑菇）、辣椒炒腐竹（炸腐竹）、凉拌豆腐丝（豆腐丝）、青椒土豆丝（土豆）

　　主食：咸鸭蛋炒饭（咸鸭蛋、青豆、火腿）、湖南的卤粉、意大利面（家里有酱和面）

　　要买的菜：虾、草鱼、瘦肉、豆角、白蘑菇、炸腐竹、豆腐丝、土豆、干辣椒和花椒、生粉、米粉

　　未来尝试：韩式拌饭（韩式辣酱、黄瓜、菠菜、胡萝卜等）、烤肉饭（鸡腿肉、生菜、黄瓜、沙拉酱）、东北锅包肉（猪里脊肉、酸甜口）、老北京炸酱面（瘦肉、黄瓜） FWCI

　　学科标准化后的科研论文影响力(Field Weighted Citation Impact,简称FWCI)

　　学科标准化后的科研论文影响力（FWCI）衡量的是与同类出版物相比被引用的出版物的好坏程度。因为它是标准化的，所以可以用来直接比较/基准化某篇文章与其他文章的性能（甚至在不同的主题领域）。FWCI是唯一的度量标准，只能通过Scopus / SciVal获得，并且是根据1996年以后在Scopus中索引的出版物进行计算的。

　　通过SciVal的基准测试模块可以轻松获得FWCI。要了解有关这些步骤的更多信息，请参阅FWCI-SciVal作者级度量的《研究影响评估》 libguide页面。

　　要在Scival上快速生成作者级别的指标，请转到SciVal的基准测试模块。

　　https://libfaq.nus.edu.sg/faq/206884 青椒生存

　　尽早证明自己；预期管理、望尘莫及；

　　参加各种活动是一把“双刃剑”，搞得不好也会影响自己的工作，特别是科研。一要注意“度”，二要注意“范围”。有些可有可无的事情还是别做，比如当歌会评委之类。初入职场的“菜鸟”要明白，院系考核教师的标准是什么。有个单词叫“工分”，就是说，你做了有些事情“算”的，而你做了别的花花草草的事情“不算”。我不提倡“为了工分而工分”，也不把工分当做自己的追求目标。我之所以提到“工分”这个概念，就是想提醒注意哪些事情是没有价值的！比如说，有的刚入职的教师，把时间花在接待本科生、整理各种表格、整理以前的文章（以前的单位是署名单位）上，如果年底没有没有正规的教学、署现单位地址的文章、科研项目，那么工分就是零！就等于你忙了一年，什么都没干！

　　其次，要摆正好心态。这个社会是奖勤罚懒、优胜略汰的社会。如果自己真的很厉害，自然能脱颖而出。但问题是，大多数人都是“正常人”，即利用有限的时间做一些研究、发一些论文，不见得真的出类拔萃。自己还需要处理好家事，这会占用很多时间。既然如此，那就埋头把自己手头的事情做好，不要矫情。

　　再次，要“看透”一些事。我认为，无论是普通青椒还是老椒，发展都不那么容易，原因在于：1）如果没有资源，那么比较难在大学发展；2）资源是有限的，资源会优先向脱颖而出的人倾斜；3）大多数人都不是超人，理论上比较难以同时把方方面面的事情做好。接受这个事实之后，人就能看开一些。这不是说自己不要努力，而是说不必强求自己“弯道超车”。

　　青椒| 看清事物发展规律，在既定条件下寻找幸福：http://blog.sciencenet.cn/blog-71964-1276630.html

　　我的经验是要放平心态，现实一点。要因地制宜，脚踏实地，撸起袖子加油干。比如说，加入教授的课题组，那就要好好干，不要攀比，不要心理不平衡。要搞清楚所在院系考核、升职的要求是什么，开展工作也抓住重点，不要考核要求的事情做得很少，而“花花草草”的事情（比如参加歌唱比赛、运动会）却做了一大堆。

　　成为高校教师后，时间严重碎片化（特别注意：事情一忙，就没有时间看文献、做实验了）。因此，需要学会“见缝插针”利用时间，并锻炼同时做几件事情能力。很多人都说当高校教师很轻松，还有寒暑假。其实不是这样的。比如说我，即便寒暑假会有短途旅游，但除此之外，几乎每天都到学校工作，哪怕自己已经评上了教授。我甚至把孩子送到英语培训机构之后，就在门外找个桌子用手提电脑工作。

　　关于进高校，研究生需要知道的：http://blog.sciencenet.cn/blog-71964-1170071.html

　　《评论：“副教授，我缺少的是什么？》，说的是一位毕业于浙大的青年教师，入职两年内申请到800万元的项目，发表25篇论文，但没评上副教授。博文中心思想是要那位没评上副教授的讲师多考虑自身的原因，最后在博文中马老师语重心长地对那位讲师说：要给周围人一种感觉，你为干事业而来，而不是为了职称而来。要知道，领导很在意你表现出来的“腔调”或者你给他的感觉。

　　内职业生涯的发展比外职业生涯的更重要。这个我已经有篇博文详细介绍，在此不再赘述。简而言之，不能简单地把工作等同于拉项目、发文章，每过个半年得问问自己，自己的各方面的能力、无论对于科研还是对于人生的认识水平有没有提高？当然，这么说，并不是说不要“外职业生涯的发展”，而是说，两者要一起发展。

　　要work smart（聪明地工作）。在大学里，考核总有些基本的指标，比如完成一定课时数、申请到科研项目、发表科研论文、指导研究生等。如果能把精力集中在这些基本的任务上，至少能生存下来，压力也没那么大。反之，没有按照工作单位要求的去做，不但把自己搞得很累，也会给家庭带来负担。妻子的科研工作就是到国外实验室，利用对方的大型仪器，集中1-2周时间测数据，然后带回来花半年时间分析数据、撰写科研论文。照理说，这种“生产模式”非常有利于既有事业又有家庭的女性科研工作者。但在入职初期，她“东一榔头西一棒子”，做了很多课题，没有及时把数据整理成文，这就造成了很大的压力。

　　时间管理也很重要。通过实践，能找到适合自己家庭使用的方法，有些书籍也能给自己“充电”。我时常翻阅的包括博恩?崔西《吃掉那只青蛙》、梁佩玲《图解时间管理》、邹鑫《小强升职记：时间管理故事书》、李践《高绩效人士的五项管理》、石田淳《不懂带人，你就自己做到死》等等。

　　http://blog.sciencenet.cn/blog-71964-844507.html

　　问：入职后的第一年非常繁忙：给本科生作学术报告、参加项目评审会、给国际刊物审稿、接待外宾、参加校运会和歌唱比赛，但年终考核的结果竟然是“基本合格”！为什么会这样？

　　答：在高校，有些东西是评价体系非常看重的，也是考核指标，类似于企业里的KPI（key performance indicator）。这包括：授课、申请到科研项目、发表科研论文、带研究生、从事学生工作和行政工作等。如果你在做好自己本职工作的前提下再参加些活动，那是锦上添花。最怕的是自己的本职工作都没有搞好还去做些“外围”的事，那会影响自己的生存和发展。

　　http://blog.sciencenet.cn/blog-71964-839206.html

　　第二个要点，你有雄心壮志，却“怀才不遇”，怎么办？A，你可以投奔“明主”，寻找你实现才华的舞台。B，你可以选择埋头苦干，要干就好好干，不要抱怨这个、抱怨那个。慢慢地，我发现了一条神秘的规律：好好做，自然会有出路。换句话说：当你没有找到把自己才能发挥得淋漓尽致的舞台时，先潜伏自己，等你自己能力积累到一定的程度，这时候忽然机遇来了，你能稳稳当当地接住机遇。我可以找出很多事情来说明“埋头苦干、逢山开路”的现象。

　　http://blog.sciencenet.cn/blog-71964-762990.html

　　做博士后时，每天就是做实验、写论文，“生产模式”比较单一。特别是在国外，人际关系相对简单。但加入教职后，情况就不那么简单了，需要面对方方面面的问题。举个例子：有一个博士后回国工作时，手上有两个工作尚未整理成文。入职后，他/她想到文章没有整理好，就等同于白干了，便整理了文章，可是这文章署名单位是以前的学校，也就是说，整理了以前的文章不算目前单位的工作量。可整理成文发给以前的导师，不知什么原因，以前的导师不修改论文，也不发表论文，而时间也一天天地流逝了。该怎么做？

　　再比如，本来博导留了一些数据给该博士后，让他/她可以回国写作，并且可以成为第一作者。但他/她却“舍近求远”，东一榔头西一棒子地测数据，还找了一堆本科生重复别人的文献，得到一堆废数据。结果没有一个工作是完整的。

　　这些都是问题。也许随着时间的推移，这些问题都能得到解决——最终出了文章。但是你要知道，用人单位最希望的是你在入职初期“立竿见影”地产出些东西，无论是项目还是文章。如果你能迅速证明自己，不但资源向你倾斜，而且早评上职称的也是你。但是很多“菜鸟”由于不知道这些issues或者politics，导致策略性的失误。

　　为了生存，我容易吗？比如说，有人联系我，写综述或者book chapter，如果我“主打”，我第一作者，但别人也得是通讯作者。我哪怕自己累得都快趴下了，还是把“活”给接了过来。再比如，在我入职的初期阶段，搭好实验装置后，别人找上门来联系科研合作，我帮别人测试样品，协助指导别人的研究生。当时如果我有一群“熟练工”帮我干活，我还需要晚上吃完晚饭再赶到学校测试别人的样品吗？还不是为了生存吗？就像刘德华刚出道时只是演被人一刀捅死的小角色——如果不演，他还能成为今天的刘德华吗？

　　http://blog.sciencenet.cn/blog-71964-758788.html 国家企业信息系统

　　国家企业信用信息公示系统：http://www.gsxt.gov.cn/index.html

　　年报填录演示：http://amr.gd.gov.cn/dawenku/qt/content/post_2910706.html

　　首次填写，注册联络员，很方便。

　　http://scjgj.gz.gov.cn->【专题专栏】->【经营yichang名录】毕业论文最后要检查的内容

　　容易在调整后出错，需要检查的内容有：

　　（1）页眉：确保绪论前的几页没有页眉，且摘要分页前后无空格。

　　（2）页码：摘要到绪论前是罗马数字的页码，绪论开始是阿拉伯数字的第1页。

　　（3）图表数量正确

　　（4）正文图表前后无较大空白

　　（5）公式的编号正确

　　（6）动漫电影

　　你好像很美味啊

　　未麻的部屋

　　辉夜姬物语

　　云之彼端约定的地方

　　回忆三部曲

　　企鹅公路

　　在这世界的角落

　　回忆中的玛妮

　　日本治愈动画短片（雨之城）

　　手冢治虫、富坚义博、谏山创豆豆对话2

　　【2021.3.16】

　　晚上五点四十左右给豆豆发消息。

　　等了等，她在晚上九点多回复了。她一上来就说：亲，抱歉迟复，我语音你？

　　后来通话了有五十多分钟：

　　（1）我讲了讲下午的经历，以及爬虫进展，问问她对数据集的想法；

　　（2）她说她最近看了很多论文总结出了四个套路，上课时候讲了一遍加深自己的印象。在我的追问下她也给我讲了一遍心得，她把现有论文分为了四类：纯理论、深访、传统量化（问卷量表）、数据分析。她也有精力活跃起来构建人脉了。

　　（3）以后工作要注意谁是在用你，谁是想真的培养你。复杂归复杂，好在总是有个可以商量的人。

　　通话完我很开心。每次我们有学术讨论的时候氛围都很活跃。附带的其他交流也让我快乐很久。豆豆对话1

　　豆豆：“我开心是因为我性格如此，你的思路就不对。你A是因为你有压力，国内百分之九十的PI都是那种。成为Prof没压力了才会松口气。”

　　兔：“那时候周围有可信的人”

　　豆豆：“你现在有我呀”

　　兔：“你这也不稳定呀”

　　豆豆：“我是稳定的，我们是稳定的呀”

　　豆豆：“不论我去哪儿，我们的关系是稳定的，我们的合作不会中断的。你看我做事是有头有尾的，我会安排好的。我们帮助别人成长，别人也会支持我们，不是用完就不理的。” A+C+O

　　是一个统称，它包括A+S、最大最小A+S、A+CS。

　　A+S：轮盘赌更新

　　A+CS：if p<p0：best更新；otherwise: 轮盘赌更新。灵感

　　（1）模拟->优化->分析

　　模拟已经够多，近期优化角度的点对点突破，中期分析方案。

　　对下启迪民智、对上建言献策。过去主要集中在影响决策者，而今后有个方向是激发市场活力。市场迸发活力，依赖于群体智慧的激发。这就绕不开调研和分析。

　　分析类工作多数集中于工程领域，而非科学领域。科学领域研究需要凝练出很好的科学问题或技术问题。如何从工程实际中凝练出很好的科学技术问题，依赖于对现实难点的洞察，设计出合理的方法、方案、系统框架。

　　学术价值评估：把你的想法写出来，按论文的格式写一两页纸，看能不能说服。说服不了就暂时搁置，这个过程不费多少时间。价值评估：似曾相识，与众不同。过程：就像战斗一样，在指定时间内完成一项任务。每天的任务，想办法完成。不要怕被人喷，就是要让人喷，错了就改。

　　历史

　　7. 我一直在想一个问题，我们身处历史何处。后来我知道了，是春秋末年，到秦大一统，再到汉初。

　　8. 游戏已经开始了，想上车就遵循游戏规则。除非你想像陶渊明一样隐居田野，那你可以不关心。

　　其他

　　9. 有些音乐，开头就很有故事感，就吸引人。名言

　　受人之托，忠人之事。

　　不明觉厉。

　　做事有头有尾的。

　　我们都是做实事的。回答

　　这三个帖子基本可以回答你的问题，分别是：方法、原理、代码

　　文本相似度算法总结：https://blog.csdn.net/qq_33373858/article/details/90812282

　　simhash算法及原理简介：https://blog.csdn.net/lengye7/article/details/79789206

　　SimHash算法（转载）——含JAVA和Python代码：https://www.cnblogs.com/qijunhui/p/8445475.html 可视化绘图

　　针线图：stem，用多个hold on，避免之前的图片被刷新。

　　折线图：按时间画图，只需要一个hold on。

　　用pause暂停一下0.5秒，控制频率。否则会只显示最后一帧。 NP难证明

　　NP-hard问题证明：https://blog.csdn.net/samjjx/article/details/87890821

　　优化问题中的np难,np不完全中的np是什么意思？https://zhidao.baidu.com/question/1893662292870010940.html

　　P、NP、NPC、NP-hard 问题及组合最优化问题的认识和理解：https://blog.csdn.net/weixin_42528077/article/details/82779896

　　NP难问题清单：https%3A//en.wikipedia.org/wiki/List_of_NP-complete_problems

　　最小顶点覆盖(Minimum Vertex Cover)与最大独立集(Maximum Independent Set)：https://blog.csdn.net/weixin_34191734/article/details/85904555

　　最大团问题（max clique problem, MCP），经典组合优化问题，SAT最大满足。 Weyl’s定理在这里插入图片描述支持 - MATLAB & Simulink

　　https://ww2.mathworks.cn/support.html?s_tid=gn_supp 资料

　　进化策略和进化规划课件：

　　https://wenku.baidu.com/view/2c38ee754793daef5ef7ba0d4a7302768f996f49.html

　　ABC算法起源与发展现状：

　　https://wenku.baidu.com/view/370bcf85f7ec4afe05a1df9c.html

　　生物信息学期刊：https://blog.csdn.net/weixin_44845357/article/details/109333371 【愤怒的郑强】

　　这么多年了，尾巴就一直漏在外面，一般人觉得这尾巴真大，心想这大的尾巴，想必是个大畜生，可惹不起！绕过去吧！突然有一天，有个长了鹿角的愣头青，非要直直的踩过去，就是不绕行，还要重重的踩一脚，甚至想砍掉这尾巴，为大家开辟一条直路。走惯了弯路的人都觉得这个长鹿角的人真奇怪。《千与千寻》背后暗藏的寓意你真的明白吗？

　　在一个无国界（ borderless）的时代，无立足之地的人是最受人鄙视的。立足之地就是过去，就是历史。在我看来，没有历史的人和忘记了过去的民族，只能如蜉蝣一般消失，或者像一只鸡一样只知埋头生蛋，直到自己被吃掉。

　　《异境中的千寻——这部电影的主旨》—— 宫崎骏 1999年11月6日

　　“曾经发生的事情不可能忘记，只是想不起来而已”，这是钱婆婆对千寻说的话。

　　https://www.sohu.com/a/321946610_100205824 如何查找文献

　　下载chrome插件：googlehelper，安装后注册，即可使用某哥学术搜索。

　　或者用思谷学术

　　https://www.jianshu.com/p/32c263df690f 这里是世界50大社会科学大学排名

　　1.英国牛津大学

　　6.英国剑桥大学

　　20.瑞士苏黎世联邦理工学院

　　21.荷兰阿姆斯特丹大学

　　22.新加坡国立大学，新加坡

　　31.英国曼彻斯特大学 amazing

　　【学术】像搞战争一样搞学术，有战略评估、有策略、有心理战、有后勤管理、有外援。价值评估：把你的想法写出来，按论文的格式写一两页纸，看能不能说服。说服不了就暂时搁置，这个过程不费多少时间。好的出品：似曾相识，与众不同。就像战斗一样，在指定时间内完成一项任务。每天的任务，想办法完成。不要怕被人喷，就是要让人喷，错了就改。我不介意分享我的idea，我是持开放的态度。跟人合作反馈要快，要给人一个好印象。那些科学家为什么做出很好的工作，看他们的论文，猜他们当时的想法。一篇论文、一本书，拿到手里，只看标题和摘要/目录，猜他们会怎么做怎么写。先猜，再看。每周都刷论文，看他们amazing的地方。所以你最近有amazing的论文分享吗。每天运动才能坚持住高强度的科研。保护新鲜感。对有些人来说，一件事搞得超过一个月，新鲜劲就过去了，就是要一鼓作气地弄完。仔细想来，大多数人其实都是这样。持久战消耗意志力。

　　【历史】读历史的目的感很强，是为了思今，不是纯粹的出于兴趣我一直在想一个问题，我们身处历史何处。后来我知道了，是春秋末年，到秦大一统，再到汉初。游戏已经开始了，想上车就遵循游戏规则。除非你想像陶渊明一样隐居田野，那你可以不关心。历史的车轮什么时候轮到我们来开。

　　【其他】在不断思考和经历中磨砺自己的世界观用手机计录灵感，积累案例，去佐证它。从而架构出完整的世界观。你要知道人家为什么愿意跟你交流，因为你对人家有价值，或者能输出价值。有些音乐，开头就很有故事感，就吸引人。用很绝对的类似“因果”的词，让人觉得你在掉书袋。英语发音，是在用喉咙位置，比中文的发音位置要低。中文发音位置发出来的英文，让人感觉很土。英文是喉咙发音，才能撑得住一系列的爆读。因此我切换英文的时候，会先清一下喉咙切换发音位置。他们很不喜欢“油腻”这个词。

　　【其他人的情商】多照顾他人，多为他人考虑照顾别人情绪，就让人感觉舒服。有宝藏男孩，会细心照顾他人情绪，考虑周到，大家和他相处都觉得舒服，到哪里都有人想找他一起做事。让人觉得舒服，就受欢迎。一个人受欢迎，偶尔犯点小错误，大家会想方设法替她兜着。一个人不受欢迎，犯一点小错误，众人巴不得把事情搞大。有些事，不上称没有四两大，上了称一千斤都打不住。抬杠让人不舒服。人们不想和抬杠的人交流。人家说“大海真好”，她说“经常淹死人”。人家问这衣服怎么样，她说“真难看”。想避免这种情况，就需要观察对方的意图。有些人能听进他人意见、想听真实的意见，你就实话实说。有些人想听到肯定，你就肯定好的地方。独处时，关注自己的状态。懒惰是一种惯性，躺着一刷手机，半天过去了，什么收获都没有，想起这个状态只觉得难受。勤奋也是一种惯性，动起来就停不下来，身心愉悦。所以懒惰时，要鼓励自己，做心理建设。

　　【生活篇（20201229）】

　　第一，饮食和咖啡篇

　　精力充沛两要素：锻炼、咖啡。

　　老T，吃苹果，桌子上十几个苹果，不吃晚饭。不吃碳水，中午两条鱼、虾，纯蛋白。

　　老Q，动脑筋快了，很容易饿，要吃东西。

　　W，少食、多样化、有零食、泡红茶。

　　第二，计算机

　　先看科普知道这个人，然后再去翻他的文章。

　　马尔的三层理论。

　　第三，关于向下兼容

　　被题选了的时候，也能做出好工作。

　　像monk一样生活：

　　减少焦虑，专注生活，就要减少对比、抱怨、批判。

　　做科研需要对比、批判，但生活是反着来的。

　　第四，关于成长

　　在信息有限的情况下，思考越多，错得越多。应该把精力用在如何获取有效信息上。