生活是一门技术,可能是我技术不行
TF-IDF全称:term frequency–inverse document frequency。翻译为:词频-逆文档频率。是一种常用于信息检索(information retrieval)与文本挖掘(text mining)的常用加权技术。TF term frequency什么是词频(term frequency),词频是指在一个文档中(document)一个词语出现的频率。举个例子。《鹧鸪天》--辛弃疾有客慨然谈功名,因追念少年时事,戏作。壮岁旌旗拥万夫,锦襜突骑渡江初。燕兵夜娖银胡䩮,汉箭朝飞金仆姑。追往事,叹今吾,春风不染白髭须。却将万字平戎策,换得东家种树书。比如对以上文章进行分词,最终可以得到100个词语。但是平戎策和种树书两个词分别出现了一次,所以他们的词频(term frequency)都是 0.01=1/100IDF inverse document frequency什么是逆文档频率(inverse document frequency),逆文档频率是指在多个文档(document set 通常是一类文档的集合)出现的频率。继续使用上面引用辛弃疾的词做例子,他一
认识JWTJWT全称:JSON Web Token,是一种将JSON对象进行Base64URL编码加密后,在各方进行令牌传输和认证的一种机制JWT的样式eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJzdWIiOiIxMjM0NTY3ODkwIiwibmFtZSI6IkpvaG4gRG9lIiwiaWF0IjoxNTE2MjM5MDIyfQ.SflKxwRJSMeKKF2QT4fwpMeJf36POk6yJV_adQssw5cJWT数据由三段构成,每一段数据使用一个点号(.)进行分割,三个数据分别是: HEADER.PAYLOAD.SIGNATURE JWT的三段构成Headerheader 包含两个部分:令牌的算法 和 令牌类型,如:{ "alg": "HS256", "typ": "JWT" } 将以上json对象使用 base64Url 编码,得到HEADERPayloadpayload 是负载,或者加有效载荷,是应用程序之间传输的真正有用的数据,如:{ &
Base64 算法中的字符组成A-Za-z0-9+/其他注意: 补空使用等号=为何使用Base64URL算法Base64URL 算法基本与 Base64一致,不过在url 中,三个特殊字符(+/=)有着特殊含义加号+表示空格斜杠/表示路劲分割等号=表示参数键值分割正是由于这三个符号在url中有特殊的意义,所以需要使用其他字符替换加号+被替换为减号-斜杆/被替换为下划线_等号=则是直接删除
UTF-8作为一种可变长度的字符编码,他是如何知道一个字符到底需要几个字节表示呢?他是如何这么智能和聪明的?比如一个中文字符,在UTF-8编码中,可能需要占据三个字节的长度,而一个英文字符仅仅需要占据一个字节的长度。他们是如何协作,才得以保证不会输出乱码呢?这一切,就要从UTF-8的规定说起了,有了这个规则,就能保证字符总是可以正确显示了。如果一个字符只需要一个字节即可表示,那这个字节的二进制必须以0开始,如:0xxxxxxx如果一个字符需要两个字节才能表示,那么这个字符的第一个字节(高位字节),需要以110开头,第二个字节(低位字节)需要以10开头,如:110xxxxx 10xxxxxx如果一个字符需要三个字节才能表示,那么这个字符的高位字节,需要以1110开头,其余后面的两个低位字节已10开头,如:1110xxxx 10xxxxxx 10xxxxxx聪明如你,一定从上面的123中发现了某种不可告人的秘密规律。假如现在是一个汉字,那么需要用三个字节表示,其中有8位已经是固定的了,还有16位是可用的。虽然是用三个字节表示,但是有效位只有16位,有效位还是占两个字节。
Maven是什么?Maven是java语言开发的,主要用于项目管理。他能干什么?他的功能有很多,但是通常而言,我们最尝使用他的两个功能:项目构建 和 依赖管理。POM是什么?全称Project Object Model,项目对象模型。Maven将一个项目的开发以及管理抽象出一个对象模型,简称POM。不论你是要开发、测试、打包、部署…… 在这个模型里都有对应的方法。pom.xml又是什么?这个文件就是POM对象模型的具体实现。如,最基本的配置,描述自己的项目: <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 https://maven.apache.org/xsd/maven-4.0.0.xsd"&g
Minghui
却道天凉好个秋!
CC BY-NC-SA 4.0