【收藏夹2020-2021】

  Excel 统计前一列 重复次数:=COUNTIF(A:A,A7)选中有公式的单元格,键盘按住shift,选中需要填充公式的最后一个单元格,选中需要填充公式的整列后,按ctrl+D,即可填充整列公式; Excel处理数据有坑

  https://www.zhihu.com/question/20096750

  在这里插入图片描述 windows离线安装Pytorch

  找到官网的地址https://download.pytorch.org/whl/torch_stable.html

  找到对应的文件,我是python3.7,安装cpu版本的

  pip install XXX 【还原论、数学知识、背景插值】

  这种还原论思想,可以说是近现代科学的一个“元命题”。不这么假设,一切科学原理的数学表述,都无从下手,也不可能展开。所谓数学的语言,所谓方程式,就是建立在这些假设的基础之上。

  还原论思想的第一点来自古希腊哲学传统中的“物质无限可分”,即相信可以通过无限切分物质,获得关于物质的精确知识;并且这种切分不损害知识本身(这一点与东方“相生相克,循环往复”的整体观知识假设完全不同)。

  第二点是一些貌似处理不确定性的科学知识,比如概率统计,需要假设“每个个体都是独立的”,彼此之间既不相互干扰,也没有个体差异(大家都一模一样)。假如不是这样,绝大多数统计规律就都不好使了。

  严格说,在一个流动的世界里,你的一眨眼工夫,这个世界已经发生了悄然的变化。表面上看,你似乎感知到这个世界连续的景象,其实这种心理上的“连续性”,是被你的背景知识“插值处理”过的。

  换个角度说“状态的涌现”,“涌现”这个词所对应的还原论科学的术语,叫作“构造”。在还原论科学里面,状态是可以构造的,可以刻画的。

  如果简单概括成一句话,我愿意说复杂性最重要的特点,就是“局部无法推知整体”。但是,从局部推知整体,恰恰是我们主流的认识论、实践论最重要的特征。

  不是有一句话,叫作“你要想知道梨子的滋味,你就要亲口尝一尝”吗?这既是实践论,也是认识论。对不对呢?我说它“几乎”是对的。“几乎”,就是说大体上这么说没啥毛病,但细想之后会有问题。因为就算你尝了“这一个”梨子的味道,你也未必知道“那一个”梨子的味道。所以我们说局部最终没有办法推知整体。认为局部可以推知整体,其实是“假设系统”出了问题。你要假设所有的梨子都一个味道,假设所有的“舌头”的味蕾都是一样的,假设所有尝梨子的人都能够用同样的语言表达自己的感受,并且还得假设这种表达是毫无障碍的,如此等等。这样做假设的方式,就是典型的还原性的方式。 NahimicSvc64.exe逻辑炸弹导致CPU直飚99%【已解决】

  有网友反应电脑巨卡,什么都操作不了,打开任务管理器后,发现多个NahimicSvc64.exe程序占用CPU过高,导致CPU100%怎么办?。NahimicSvc64.exe / NahimicSvc32.exe是微软的纳美音效驱动,可以考虑禁用。

  【解决办法】:

  此电脑”->“管理”->“计算机管理”->“服务和应用程序”后->“服务”->找到 Nahimic Service 服务->把启动类型改为:手动或者禁用;

  最后用管理员身份启动cmd,输入下列命令,删除电脑中所有正在运行的进程:

  taskkill /F /im NahimicSvc64.exe gephi 中文标签乱码

  需要把字体改为“宋体”

  sum(corpus, []) Python tensorflow报错

  (1)AttributeError: module ‘tensorflow‘ has no attribute ‘placeholder‘解决办法

  将: tf.placeholder

  改为:tf.compat.v1.placeholder

  (2)module ‘tensorflow’ has no attribute 'random_uniform’解决办法

  将:tf.random_uniform

  改为:tf.random.uniform

  (3)module ‘tensorflow’ has no attribute ‘truncated_normal’ 解决办法

  将:tf.truncated_normal

  改为:tf.random.truncated_normal

  (4)module ‘tensorflow._api.v2.train’ has no attribute ‘AdamOptimizer’ 解决办法

  将:tf.train.AdamOptimizer

  改为:tf.optimizers.Adam

  (5)minimize() missing 1 required positional argument: ‘var_list’

  需要指定w和b:optimizer = tf.optimizers.SGD(name=‘SGD’).minimize(cost,var_list=[W,b])

  (6) is required when a loss is passed.

  需要指定tape:tf.optimizers.SGD(name=‘SGD’).minimize(cost,var_list=[W,b],tape=tf.GradientTape()) 在win10环境部署bert,client端一直运行,且无输出

  我在跑一个程序时,出现了这行代码。

  from bert_serving.client import BertClient

  查看一些博客,只通过cmd输入两行安装代码:

  在这里插入图片描述

  代码没有错误,可以运行,但是一直不出现结果。我最开始以为是数据太大,运行时间过长。但是我把单行代码逐一测试,发现无法出结果。

  在这里插入图片描述

  解决办法:

  1:安装了Tensorflow环境(我一直以为这个论文程序是pytorch版本,没想到这两行代码是需要tensorflow的环境。也有一个收获就是pytorh和tensorflow也可以在同一个环境中使用)

  2:https://blog.csdn.net/w417950004/article/details/99080193

  按照这个博客的步骤去做,就可以了。

  原文链接:https://blog.csdn.net/zhaoluwei/article/details/109343477 bert_serving报错

  运行:from bert_serving.client import BertClient

  报错:ModuleNotFoundError: No module named ‘bert_serving.client’

  解决:

  先前我们不知道z的shape属性是多少,但是想让z变成只有一列,行数不知道多少,通过`z.reshape(-1,1),Numpy自动计算出有16行,新的数组shape属性为(16, 1),与原来的(4, 4)配套。 正则匹配RT @

  (1)正则表达式[w.]表示什么意思?

  答:w 匹配字母或数字或下划线, [ ] 匹配中括号里的任意一个字符,合在一起就是匹配任意一个字母数字下划线或 “.”。

  (2)正则表达式b表示什么意思?

  答:b代表字与字中间那个看不见的东西,如 here is a word 那么,这句中有好几个b, 每个单词的前后都有一个b。

  B就是反过来,代表非字间。 类似d代表数字, D代表非数字。

  (3)字符 ^ 和 $ 同时使用时,表示精确匹配(字符串与模式一样)

  例如:^bucket$,只匹配字符串 “bucket”。

  (4)如果一个模式不包括 ^ 和 $,那么它与任何包含该模式的字符串匹配。

  参考:https://www.runoob.com/regexp/regexp-rule.html

  (5)RegexString中,最好指定Advance=1,采用C#正则表达式格式

  RegexString(Text,Rule,[Advance],[Index]) 参数说明:Text指待处理的字符串文本。Rule指正在表达式,支持常用的正则表达式,为了简化操作,可使用诸如“数字”、“字母”、“小写字母”、“大写字母”、“汉字”等名词代替正则表达式。Advance指正则表达式Rule的书写模式,默认是0,表示使用简单模式,如果设置成1表示高级模式,即Rule是C#正则表达式,比如匹配数字应书写成([d]{0,})。Index指多个结果时返回全部还是指定的结果,可选参数,默认0,返回全部,1表示返回第一个结果。 Pandas读写容易忘

  DataFrame转list:df.values.tolist()

  DataFrame转numpy数组:np.array(df)

  pandas读csv:pd.read_csv(file, sep=’,’)

  pandas写csv:df.to_csv(file, index=False) 【记录】

  关注技术进步与落后 vs 关注人的主体性

  需要密集劳动 vs 需要思考和调查

  样本差异最大化

  对理论有所回应 用EXCEL绘制甘特图

  https://www.ixigua.com/6800710859178902027?fromvsogou=1&utm_source=sogou_duanshipin&utm_medium=sogou_referral&utm_campaign=cooperation&wid_try=1 词云绘制

  数据挖掘实战:Twitter情感分析

  https://zhuanlan.zhihu.com/p/51758566

  wordcloud 词云 关键字重复多次

  问题代码如下:

  与collocations参数有关,默认collocations=True,会统计搭配词。比如你的text是“我在拜访客户”,当collocations为True时,就会把“拜访客户”也当作一个词进行统计,所以会出现重复。

  wcd=WordCloud(font_path=‘simsun.ttc’, collocations=False,width=900,height=400,background_color=‘white’,max_words=100,scale=1.5).generate(text) 英文标点

  结果:向量化后的并行运算速度要比普通的执行速度快很多

  speed_times:2.7337491512298584

  speed_times:9.00490427017212

  excluded选项可以指定排除序列化的参数:

  或者采用指定位置的方式排除:

  vpolyval.excluded.add(0) vpolyval([1, 2, 3], x=[0, 1])

  # 输出:array([3, 6])

  独立级联模型&线性阈值模型:https://blog.csdn.net/qq_34328980/article/details/107712550

  在这里插入图片描述

  独立级联模型(知乎):https://zhuanlan.zhihu.com/p/164608949

  在这里插入图片描述 word打字输入时卡顿有延迟?

  https://www.zhihu.com/question/433858568 网络分析工具

  NodeXL(Excel插件):https://www.jzwcom.com/jzw/c0/12306.html python datetime,字符串,时间戳相互转换

  Pandas 取消第一列作为索引

  pandas.read_csv 参数 index_col

  index_col : int or sequence or False, default None

  在默认index_col=None时,pandas会自动将第一列作为索引,并额外添加一列。

  在使用index_col=0时,直接将第一列作为索引,不额外添加列。

  可以设定index_col=False 来使得pandas不使用第一列作为行索引。 Python导入自定义模块

  from … import module_name:导入本模块上一级目录的模块。

  from …package_name import module_name。导入本模块上一级目录下的包中的模块。 需要搞清楚的Python概念

  语法装饰器

  闭包 关键词共现/属性共现矩阵

  第一步:Python构建关键词共现矩阵 (https://blog.csdn.net/alanconstantinelau/article/details/69258443)

  第二步:python构建关键词共现矩阵速度优化

  (https://blog.csdn.net/qklwdd6/article/details/79148582)

  第三步:Python构建关键词共现/属性共现矩阵

  (https://blog.csdn.net/alanconstantinelau/article/details/69258443)

  把几个词归为一个属性,这样构造的属性共现矩阵就可以大大减少矩阵中数目为0的部分,而且会增大共现次数。

  在这里插入图片描述 python爬取百度时出现,百度安全验证,解决方法

  解决办法(在请求头中添加accept即可)

  在这里插入图片描述

  参考:https://blog.csdn.net/cute_boy_/article/details/106125023 soup.find()和soup.find_all()

  soup.find和soup.find_all中的参数是一样的。不相信可以在pycharm中,按住ctrl单击我们的soup.find函数,然后我们会看到这样一个定义:

  其实内部调用的就是find_all,然后取的是第一个元素。

  另对于此类型的标签元素,我们不能使用,因为class是定义一个类的关键字,而此关键字是不能作为参数的。

  原文链接:https://blog.csdn.net/qq_26460841/article/details/87867293 用Python对自己的文章做文本分析

  (1)得到每一篇文章的关键词;

  用Python计算每篇文章每个词的tf-idf值,需要先对每个文本进行分词,对每个词需要遍历所有的文本的所有词,工作量比较大。硬上的话,代码效率估计会比较低。但是!在看jieba算法的时候,惊奇的发现jieba算法已经内嵌有TF-IDF算法(当然也有TextRank算法),不用造轮子的感觉很舒服,核心代码如下。

  (2)使用这些关键词生成所有文本的关键词共现网络。

  关键词共现网络构造的关键是构造共词矩阵。在已经得到每一篇文章的关键词后,假如不考虑每个词的连接强度的计算方法,共词矩阵的构造非常简单,只需要将所有关键词提取出来,将每两个关键词共同出现的次数分别计算出来形成矩阵即可。

  在完成共词矩阵的构造后,绘图部分同样使用Python实现,所幸在Python中也有前人做好了轮子。使用的是networkx。

  链接:https://www.jianshu.com/p/1f6ff76a8abb 查询数据库表的列注释

  查看所有表注释:

  查看所有表和字段注释(代码中的a和b不用改):

  查看某表所有列注释:

  或

  ( 对表的meta data的查询需要使用information_schema.tables, table_schema是数据库的名称,table_name是具体的表名,table_type指的是表的类型) 直接获取网页编码并赋给r.encoding

  chardet检测字符串/文件编码模块,chardet.detect()返回字典

  import requests

  r=requests.get(‘http://www.baidu.com’)

  r.encoding=chardet.detect(r.content)[‘encoding’]

  print r.text #这样输出的文本不会有乱码 查看Python包的安装位置

  module.file reportLab的单位

  from reportlab.lib.units import cm, inch, mm, pica, toLength

  print(cm) # 28.346456692913385

  print(inch) # 72.0

  print(mm) # 2.834645669291339

  print(pica) # 12.0,派卡的意思

  1像素=0.026458厘米

  1厘米=28像素 只言片语

  很多时候别人表达出来的意思和你领会到的意思可能完全不同,在许多情况下,我们需要反复沟通才能确认对方的意思。

  成功并不是由于脑海里堆砌的大道理,而是由于其掌握处理各种实际矛盾的能力。一个普通家庭的孩子,即便自己始终奋进,也需要很长时间才能掌握这些技巧,因此他们的成功往往需要时间的积累。 python字典按值排序输出

  y=sorted(d.items(),key=lambda x:x[1],reverse=False)

  注:reverse默认等于False,从小到大排序。等于True时,从大到小排序。 正则表达式匹配特定汉字开头与结尾的词语

  比如一段话中存在“省教育厅,市教育局,省公安厅,省卫健委,省贸促会,省办公厅”等单位,如何用正则表达式匹配?开头为“省”或“市”,结尾为“厅”“局”“办”“办公室”“委”“委员会”等。

  正则表达式中的括号:

  中括号[]表示匹配内部任一单个字符;

  小括号()表示匹配字符或字符串组;

  大括号{}一般表示匹配的长度;

  注意:小括号本身不匹配任何东西,也不限制匹配任何东西,只是把括号内的内容作为同一个表达式来处理。中括号表示匹配的字符在[]中,并且只能出现一次,并且特殊字符写在[]会被当成普通字符来匹配。

  在方括号[ ]中,除了^,-,一切特殊符号全部失效。 你的[^abc.?.zip]这个正则表达式,实际意思是,匹配除了a,b,c,.,,?,z,i,p之外的一切字符 “b”:匹配单词边界

  单词边界:是指空格或标点符号

  " hello?" 这个左右2侧都有边界

  " world0" 这个表示左侧有边界,右侧没有边界 正则匹配除特定字符外的所有字符

  # 匹配除空格外的所有字符:S、[^s] 匹配HashTag

  上述表达式有问题,没有排除井号。

  上述表达式还是有问题,只检索出第一个hashtag,没有获取到后面的。

  上述表达式能输出正确结果,即所有的hashtag。**原因是^必须从字符串开头开始匹配,$必须匹配字符串结尾,而不能匹配字符串中间的某个子字符串。**具体见下面案例:

  多加了一个开头符“^”,结果就只输出一个:

  在这里插入图片描述 什么是分布式新闻?

  1、分布式是借用的计算机的术语, 是从“分布式计算”来的。

  2、社交媒体的应用,使得新闻生产逐步趋向分布式,即多种主体在自组织模式下共同参与某一个话题的报道。

  3、人工智能等技术将进一步推动分布式新闻生产的普及,甚至分布式生产的参与者将扩展到物体。

  4、在分布式新闻这样的模式中,各种主体的资源发现和整合,报道任务的分配与报道过程的协同,是发展的核心。

  分布式新闻意味着新闻生产进一步去中心化。专业媒体索然仍然不可取代,但是并非唯一决定性力量。

  注:分布式系统属于一种软件系统,并且内聚性以及透明性较强,其中的内聚性指所有的数据库分布都拥有自己专门的管理系统,其中的透明性主要是针对用户而言,所有的数据库分布都能保证自己的透明性。分布式系统并没有统一的定义,分布式软件是进行具体的分布式处理的一种有效软件,通过网络互联执行各种任务,其中包括操作系统、程序设计、文件系统以及数据库系统等。

  作者:Thunder

  链接:https://www.zhihu.com/question/27233184/answer/279469881

  分布式新闻是指多种主体共同参与报道。随着互联网的发展,节点化传播兴起,每个人都是庞大互联网上的一个传播节点,也是生产信息的自媒体。在信息爆炸的时代,专业媒体往往不能发布新闻事件的全貌,这时候自媒体们各显神通,发布自己所知的信息进行补充,这就是早期的分布式新闻。等等等等,怎么有点策展新闻、液态新闻业内味儿了?其实网络传播时代,传播的核心就是你一句,我一句,大家一起来嘛~花样千千万,但话语平权的核心不会变!如今,随着传感器、无人机等新技术的普及,人不再成为分布式新闻的唯一参与者,物体也能参与其中,分布式新闻会整合专业媒体、自媒体以及传感器新技术等多重资源,共同进行报道。比如此次疫情期间,乡村无人机喊话,丁香医生更新疫情地图等,这些技术都是分布式新闻的参与主体。当然,因为参与主体的广泛和稂莠不齐,分布式新闻在实际应用中很可能产生假新闻、媒介暴力等各种媒介伦理失范现象。但总的来说,分布式新闻促进了新闻生产的去中心化,多元主体的参与也能帮助一个新闻多角度展现,这一概念也可以和彭兰教授的“节点化生存”一起使用哦~

  作者:夏日之阳的马甲

  链接:https://www.zhihu.com/question/27233184/answer/1411402936 大数据分析常用工具

  在这里插入图片描述 MOOC视频存放在哪?

  第一:手机中国大学慕课下载课程高清视频完成。

  第二:打开【本地文件】选项找到【android】系统文件夹进入。

  第三:在【android】系统文件下点击【data】数据文件夹。

  第四:在数据文件夹下点击【com.neatease.edu.ucmooc】-【files】。

  第五:在慕课文件夹下点击【xcache】找到离线缓存文件。

  第六:打开离线文件夹找到【下载的视频】完成。

  下载视频可以调节清晰度

  超萌新级的Python学习心得——字体颜色:https://zhuanlan.zhihu.com/p/51328543

  性能工具之linux三剑客awk、grep、sed 食谱

  荤菜:酸菜鱼(草鱼)、肉末豆角(四季豆)、重庆辣子鸡(家里有鸡肉)

  素菜:干炸蘑菇(白蘑菇)、辣椒炒腐竹(炸腐竹)、凉拌豆腐丝(豆腐丝)、青椒土豆丝(土豆)

  主食:咸鸭蛋炒饭(咸鸭蛋、青豆、火腿)、湖南的卤粉、意大利面(家里有酱和面)

  要买的菜:虾、草鱼、瘦肉、豆角、白蘑菇、炸腐竹、豆腐丝、土豆、干辣椒和花椒、生粉、米粉

  未来尝试:韩式拌饭(韩式辣酱、黄瓜、菠菜、胡萝卜等)、烤肉饭(鸡腿肉、生菜、黄瓜、沙拉酱)、东北锅包肉(猪里脊肉、酸甜口)、老北京炸酱面(瘦肉、黄瓜) FWCI

  学科标准化后的科研论文影响力(Field Weighted Citation Impact,简称FWCI)

  学科标准化后的科研论文影响力(FWCI)衡量的是与同类出版物相比被引用的出版物的好坏程度。因为它是标准化的,所以可以用来直接比较/基准化某篇文章与其他文章的性能(甚至在不同的主题领域)。FWCI是唯一的度量标准,只能通过Scopus / SciVal获得,并且是根据1996年以后在Scopus中索引的出版物进行计算的。

  通过SciVal的基准测试模块可以轻松获得FWCI。要了解有关这些步骤的更多信息,请参阅FWCI-SciVal作者级度量的《研究影响评估》 libguide页面。

  要在Scival上快速生成作者级别的指标,请转到SciVal的基准测试模块。

  https://libfaq.nus.edu.sg/faq/206884 青椒生存

  尽早证明自己;预期管理、望尘莫及;

  参加各种活动是一把“双刃剑”,搞得不好也会影响自己的工作,特别是科研。一要注意“度”,二要注意“范围”。有些可有可无的事情还是别做,比如当歌会评委之类。初入职场的“菜鸟”要明白,院系考核教师的标准是什么。有个单词叫“工分”,就是说,你做了有些事情“算”的,而你做了别的花花草草的事情“不算”。我不提倡“为了工分而工分”,也不把工分当做自己的追求目标。我之所以提到“工分”这个概念,就是想提醒注意哪些事情是没有价值的!比如说,有的刚入职的教师,把时间花在接待本科生、整理各种表格、整理以前的文章(以前的单位是署名单位)上,如果年底没有没有正规的教学、署现单位地址的文章、科研项目,那么工分就是零!就等于你忙了一年,什么都没干!

  其次,要摆正好心态。这个社会是奖勤罚懒、优胜略汰的社会。如果自己真的很厉害,自然能脱颖而出。但问题是,大多数人都是“正常人”,即利用有限的时间做一些研究、发一些论文,不见得真的出类拔萃。自己还需要处理好家事,这会占用很多时间。既然如此,那就埋头把自己手头的事情做好,不要矫情。

  再次,要“看透”一些事。我认为,无论是普通青椒还是老椒,发展都不那么容易,原因在于:1)如果没有资源,那么比较难在大学发展;2)资源是有限的,资源会优先向脱颖而出的人倾斜;3)大多数人都不是超人,理论上比较难以同时把方方面面的事情做好。接受这个事实之后,人就能看开一些。这不是说自己不要努力,而是说不必强求自己“弯道超车”。

  青椒| 看清事物发展规律,在既定条件下寻找幸福:http://blog.sciencenet.cn/blog-71964-1276630.html

  我的经验是要放平心态,现实一点。要因地制宜,脚踏实地,撸起袖子加油干。比如说,加入教授的课题组,那就要好好干,不要攀比,不要心理不平衡。要搞清楚所在院系考核、升职的要求是什么,开展工作也抓住重点,不要考核要求的事情做得很少,而“花花草草”的事情(比如参加歌唱比赛、运动会)却做了一大堆。

  成为高校教师后,时间严重碎片化(特别注意:事情一忙,就没有时间看文献、做实验了)。因此,需要学会“见缝插针”利用时间,并锻炼同时做几件事情能力。很多人都说当高校教师很轻松,还有寒暑假。其实不是这样的。比如说我,即便寒暑假会有短途旅游,但除此之外,几乎每天都到学校工作,哪怕自己已经评上了教授。我甚至把孩子送到英语培训机构之后,就在门外找个桌子用手提电脑工作。

  关于进高校,研究生需要知道的:http://blog.sciencenet.cn/blog-71964-1170071.html

  《评论:“副教授,我缺少的是什么?》,说的是一位毕业于浙大的青年教师,入职两年内申请到800万元的项目,发表25篇论文,但没评上副教授。博文中心思想是要那位没评上副教授的讲师多考虑自身的原因,最后在博文中马老师语重心长地对那位讲师说:要给周围人一种感觉,你为干事业而来,而不是为了职称而来。要知道,领导很在意你表现出来的“腔调”或者你给他的感觉。

  内职业生涯的发展比外职业生涯的更重要。这个我已经有篇博文详细介绍,在此不再赘述。简而言之,不能简单地把工作等同于拉项目、发文章,每过个半年得问问自己,自己的各方面的能力、无论对于科研还是对于人生的认识水平有没有提高?当然,这么说,并不是说不要“外职业生涯的发展”,而是说,两者要一起发展。

  要work smart(聪明地工作)。在大学里,考核总有些基本的指标,比如完成一定课时数、申请到科研项目、发表科研论文、指导研究生等。如果能把精力集中在这些基本的任务上,至少能生存下来,压力也没那么大。反之,没有按照工作单位要求的去做,不但把自己搞得很累,也会给家庭带来负担。妻子的科研工作就是到国外实验室,利用对方的大型仪器,集中1-2周时间测数据,然后带回来花半年时间分析数据、撰写科研论文。照理说,这种“生产模式”非常有利于既有事业又有家庭的女性科研工作者。但在入职初期,她“东一榔头西一棒子”,做了很多课题,没有及时把数据整理成文,这就造成了很大的压力。

  时间管理也很重要。通过实践,能找到适合自己家庭使用的方法,有些书籍也能给自己“充电”。我时常翻阅的包括博恩?崔西《吃掉那只青蛙》、梁佩玲《图解时间管理》、邹鑫《小强升职记:时间管理故事书》、李践《高绩效人士的五项管理》、石田淳《不懂带人,你就自己做到死》等等。

  http://blog.sciencenet.cn/blog-71964-844507.html

  问:入职后的第一年非常繁忙:给本科生作学术报告、参加项目评审会、给国际刊物审稿、接待外宾、参加校运会和歌唱比赛,但年终考核的结果竟然是“基本合格”!为什么会这样?

  答:在高校,有些东西是评价体系非常看重的,也是考核指标,类似于企业里的KPI(key performance indicator)。这包括:授课、申请到科研项目、发表科研论文、带研究生、从事学生工作和行政工作等。如果你在做好自己本职工作的前提下再参加些活动,那是锦上添花。最怕的是自己的本职工作都没有搞好还去做些“外围”的事,那会影响自己的生存和发展。

  http://blog.sciencenet.cn/blog-71964-839206.html

  第二个要点,你有雄心壮志,却“怀才不遇”,怎么办?A,你可以投奔“明主”,寻找你实现才华的舞台。B,你可以选择埋头苦干,要干就好好干,不要抱怨这个、抱怨那个。慢慢地,我发现了一条神秘的规律:好好做,自然会有出路。换句话说:当你没有找到把自己才能发挥得淋漓尽致的舞台时,先潜伏自己,等你自己能力积累到一定的程度,这时候忽然机遇来了,你能稳稳当当地接住机遇。我可以找出很多事情来说明“埋头苦干、逢山开路”的现象。

  http://blog.sciencenet.cn/blog-71964-762990.html

  做博士后时,每天就是做实验、写论文,“生产模式”比较单一。特别是在国外,人际关系相对简单。但加入教职后,情况就不那么简单了,需要面对方方面面的问题。举个例子:有一个博士后回国工作时,手上有两个工作尚未整理成文。入职后,他/她想到文章没有整理好,就等同于白干了,便整理了文章,可是这文章署名单位是以前的学校,也就是说,整理了以前的文章不算目前单位的工作量。可整理成文发给以前的导师,不知什么原因,以前的导师不修改论文,也不发表论文,而时间也一天天地流逝了。该怎么做?

  再比如,本来博导留了一些数据给该博士后,让他/她可以回国写作,并且可以成为第一作者。但他/她却“舍近求远”,东一榔头西一棒子地测数据,还找了一堆本科生重复别人的文献,得到一堆废数据。结果没有一个工作是完整的。

  这些都是问题。也许随着时间的推移,这些问题都能得到解决——最终出了文章。但是你要知道,用人单位最希望的是你在入职初期“立竿见影”地产出些东西,无论是项目还是文章。如果你能迅速证明自己,不但资源向你倾斜,而且早评上职称的也是你。但是很多“菜鸟”由于不知道这些issues或者politics,导致策略性的失误。

  为了生存,我容易吗?比如说,有人联系我,写综述或者book chapter,如果我“主打”,我第一作者,但别人也得是通讯作者。我哪怕自己累得都快趴下了,还是把“活”给接了过来。再比如,在我入职的初期阶段,搭好实验装置后,别人找上门来联系科研合作,我帮别人测试样品,协助指导别人的研究生。当时如果我有一群“熟练工”帮我干活,我还需要晚上吃完晚饭再赶到学校测试别人的样品吗?还不是为了生存吗?就像刘德华刚出道时只是演被人一刀捅死的小角色——如果不演,他还能成为今天的刘德华吗?

  http://blog.sciencenet.cn/blog-71964-758788.html 国家企业信息系统

  国家企业信用信息公示系统:http://www.gsxt.gov.cn/index.html

  年报填录演示:http://amr.gd.gov.cn/dawenku/qt/content/post_2910706.html

  首次填写,注册联络员,很方便。

  http://scjgj.gz.gov.cn->【专题专栏】->【经营yichang名录】 毕业论文最后要检查的内容

  容易在调整后出错,需要检查的内容有:

  (1)页眉:确保绪论前的几页没有页眉,且摘要分页前后无空格。

  (2)页码:摘要到绪论前是罗马数字的页码,绪论开始是阿拉伯数字的第1页。

  (3)图表数量正确

  (4)正文图表前后无较大空白

  (5)公式的编号正确

  (6) 动漫电影

  你好像很美味啊

  未麻的部屋

  辉夜姬物语

  云之彼端约定的地方

  回忆三部曲

  企鹅公路

  在这世界的角落

  回忆中的玛妮

  日本治愈动画短片(雨之城)

  手冢治虫、富坚义博、谏山创 豆豆对话2

  【2021.3.16】

  晚上五点四十左右给豆豆发消息。

  等了等,她在晚上九点多回复了。她一上来就说:亲,抱歉迟复,我语音你?

  后来通话了有五十多分钟:

  (1)我讲了讲下午的经历,以及爬虫进展,问问她对数据集的想法;

  (2)她说她最近看了很多论文总结出了四个套路,上课时候讲了一遍加深自己的印象。在我的追问下她也给我讲了一遍心得,她把现有论文分为了四类:纯理论、深访、传统量化(问卷量表)、数据分析。她也有精力活跃起来构建人脉了。

  (3)以后工作要注意谁是在用你,谁是想真的培养你。复杂归复杂,好在总是有个可以商量的人。

  通话完我很开心。每次我们有学术讨论的时候氛围都很活跃。附带的其他交流也让我快乐很久。 豆豆对话1

  豆豆:“我开心是因为我性格如此,你的思路就不对。你A是因为你有压力,国内百分之九十的PI都是那种。成为Prof没压力了才会松口气。”

  兔:“那时候周围有可信的人”

  豆豆:“你现在有我呀”

  兔:“你这也不稳定呀”

  豆豆:“我是稳定的,我们是稳定的呀”

  豆豆:“不论我去哪儿,我们的关系是稳定的,我们的合作不会中断的。你看我做事是有头有尾的,我会安排好的。我们帮助别人成长,别人也会支持我们,不是用完就不理的。” A+C+O

  是一个统称,它包括A+S、最大最小A+S、A+CS。

  A+S:轮盘赌更新

  A+CS:if p<p0:best更新;otherwise: 轮盘赌更新。 灵感

  (1)模拟->优化->分析

  模拟已经够多,近期优化角度的点对点突破,中期分析方案。

  对下启迪民智、对上建言献策。过去主要集中在影响决策者,而今后有个方向是激发市场活力。市场迸发活力,依赖于群体智慧的激发。这就绕不开调研和分析。

  分析类工作多数集中于工程领域,而非科学领域。科学领域研究需要凝练出很好的科学问题或技术问题。如何从工程实际中凝练出很好的科学技术问题,依赖于对现实难点的洞察,设计出合理的方法、方案、系统框架。

  学术 价值评估:把你的想法写出来,按论文的格式写一两页纸,看能不能说服。说服不了就暂时搁置,这个过程不费多少时间。价值评估:似曾相识,与众不同。过程:就像战斗一样,在指定时间内完成一项任务。每天的任务,想办法完成。不要怕被人喷,就是要让人喷,错了就改。

  历史

  7. 我一直在想一个问题,我们身处历史何处。后来我知道了,是春秋末年,到秦大一统,再到汉初。

  8. 游戏已经开始了,想上车就遵循游戏规则。除非你想像陶渊明一样隐居田野,那你可以不关心。

  其他

  9. 有些音乐,开头就很有故事感,就吸引人。 名言

  受人之托,忠人之事。

  不明觉厉。

  做事有头有尾的。

  我们都是做实事的。 回答

  这三个帖子基本可以回答你的问题,分别是:方法、原理、代码

  文本相似度算法总结:https://blog.csdn.net/qq_33373858/article/details/90812282

  simhash算法及原理简介:https://blog.csdn.net/lengye7/article/details/79789206

  SimHash算法(转载)——含JAVA和Python代码:https://www.cnblogs.com/qijunhui/p/8445475.html 可视化绘图

  针线图:stem,用多个hold on,避免之前的图片被刷新。

  折线图:按时间画图,只需要一个hold on。

  用pause暂停一下0.5秒,控制频率。否则会只显示最后一帧。 NP难证明

  NP-hard问题证明:https://blog.csdn.net/samjjx/article/details/87890821

  优化问题中的np难,np不完全中的np是什么意思?https://zhidao.baidu.com/question/1893662292870010940.html

  P、NP、NPC、NP-hard 问题及组合最优化问题的认识和理解:https://blog.csdn.net/weixin_42528077/article/details/82779896

  NP难问题清单:https%3A//en.wikipedia.org/wiki/List_of_NP-complete_problems

  最小顶点覆盖(Minimum Vertex Cover)与最大独立集(Maximum Independent Set):https://blog.csdn.net/weixin_34191734/article/details/85904555

  最大团问题(max clique problem, MCP),经典组合优化问题,SAT最大满足。 Weyl’s定理在这里插入图片描述 支持 - MATLAB & Simulink

  https://ww2.mathworks.cn/support.html?s_tid=gn_supp 资料

  进化策略和进化规划课件:

  https://wenku.baidu.com/view/2c38ee754793daef5ef7ba0d4a7302768f996f49.html

  ABC算法起源与发展现状:

  https://wenku.baidu.com/view/370bcf85f7ec4afe05a1df9c.html

  生物信息学期刊:https://blog.csdn.net/weixin_44845357/article/details/109333371 【愤怒的郑强】

  这么多年了,尾巴就一直漏在外面,一般人觉得这尾巴真大,心想这大的尾巴,想必是个大畜生,可惹不起!绕过去吧! 突然有一天,有个长了鹿角的愣头青,非要直直的踩过去,就是不绕行,还要重重的踩一脚,甚至想砍掉这尾巴,为大家开辟一条直路。 走惯了弯路的人都觉得这个长鹿角的人真奇怪。 《千与千寻》背后暗藏的寓意你真的明白吗?

  在一个无国界( borderless)的时代,无立足之地的人是最受人鄙视的。立足之地就是过去,就是历史。 在我看来,没有历史的人和忘记了过去的民族,只能如蜉蝣一般消失,或者像一只鸡一样只知埋头生蛋,直到自己被吃掉。

  《 异境中的千寻——这部电影的主旨》—— 宫崎骏 1999年11月6日

  “曾经发生的事情不可能忘记,只是想不起来而已”,这是钱婆婆对千寻说的话。

  https://www.sohu.com/a/321946610_100205824 如何查找文献

  下载chrome插件:googlehelper,安装后注册,即可使用某哥学术搜索。

  或者用思谷学术

  https://www.jianshu.com/p/32c263df690f 这里是世界50大社会科学大学排名

  1.英国牛津大学

  6.英国剑桥大学

  20.瑞士苏黎世联邦理工学院

  21.荷兰阿姆斯特丹大学

  22.新加坡国立大学,新加坡

  31.英国曼彻斯特大学 amazing

  【学术】 像搞战争一样搞学术,有战略评估、有策略、有心理战、有后勤管理、有外援。 价值评估:把你的想法写出来,按论文的格式写一两页纸,看能不能说服。说服不了就暂时搁置,这个过程不费多少时间。好的出品:似曾相识,与众不同。就像战斗一样,在指定时间内完成一项任务。每天的任务,想办法完成。不要怕被人喷,就是要让人喷,错了就改。我不介意分享我的idea,我是持开放的态度。跟人合作反馈要快,要给人一个好印象。那些科学家为什么做出很好的工作,看他们的论文,猜他们当时的想法。一篇论文、一本书,拿到手里,只看标题和摘要/目录,猜他们会怎么做怎么写。先猜,再看。每周都刷论文,看他们amazing的地方。所以你最近有amazing的论文分享吗。每天运动才能坚持住高强度的科研。保护新鲜感。对有些人来说,一件事搞得超过一个月,新鲜劲就过去了,就是要一鼓作气地弄完。仔细想来,大多数人其实都是这样。持久战消耗意志力。

  【历史】 读历史的目的感很强,是为了思今,不是纯粹的出于兴趣 我一直在想一个问题,我们身处历史何处。后来我知道了,是春秋末年,到秦大一统,再到汉初。游戏已经开始了,想上车就遵循游戏规则。除非你想像陶渊明一样隐居田野,那你可以不关心。历史的车轮什么时候轮到我们来开。

  【其他】 在不断思考和经历中磨砺自己的世界观 用手机计录灵感,积累案例,去佐证它。从而架构出完整的世界观。你要知道人家为什么愿意跟你交流,因为你对人家有价值,或者能输出价值。有些音乐,开头就很有故事感,就吸引人。用很绝对的类似“因果”的词,让人觉得你在掉书袋。英语发音,是在用喉咙位置,比中文的发音位置要低。中文发音位置发出来的英文,让人感觉很土。英文是喉咙发音,才能撑得住一系列的爆读。因此我切换英文的时候,会先清一下喉咙切换发音位置。他们很不喜欢“油腻”这个词。

  【其他人的情商】 多照顾他人,多为他人考虑 照顾别人情绪,就让人感觉舒服。有宝藏男孩,会细心照顾他人情绪,考虑周到,大家和他相处都觉得舒服,到哪里都有人想找他一起做事。让人觉得舒服,就受欢迎。一个人受欢迎,偶尔犯点小错误,大家会想方设法替她兜着。一个人不受欢迎,犯一点小错误,众人巴不得把事情搞大。 有些事,不上称没有四两大,上了称一千斤都打不住。抬杠让人不舒服。人们不想和抬杠的人交流。人家说“大海真好”,她说“经常淹死人”。人家问这衣服怎么样,她说“真难看”。想避免这种情况,就需要观察对方的意图。有些人能听进他人意见、想听真实的意见,你就实话实说。有些人想听到肯定,你就肯定好的地方。独处时,关注自己的状态。懒惰是一种惯性,躺着一刷手机,半天过去了,什么收获都没有,想起这个状态只觉得难受。勤奋也是一种惯性,动起来就停不下来,身心愉悦。所以懒惰时,要鼓励自己,做心理建设。

  【生活篇(20201229)】

  第一,饮食和咖啡篇

  精力充沛两要素:锻炼、咖啡。

  老T,吃苹果,桌子上十几个苹果,不吃晚饭。不吃碳水,中午两条鱼、虾,纯蛋白。

  老Q,动脑筋快了,很容易饿,要吃东西。

  W,少食、多样化、有零食、泡红茶。

  第二,计算机

  先看科普知道这个人,然后再去翻他的文章。

  马尔的三层理论。

  第三,关于向下兼容

  被题选了的时候,也能做出好工作。

  像monk一样生活:

  减少焦虑,专注生活,就要减少对比、抱怨、批判。

  做科研需要对比、批判,但生活是反着来的。

  第四,关于成长

  在信息有限的情况下,思考越多,错得越多。应该把精力用在如何获取有效信息上。