189 8069 5689

go语言如何去掉部分字串,go 字符串替换

基础知识 - Golang 中的格式化输入输出

【格式化输出】

主要从事网页设计、PC网站建设(电脑版网站建设)、wap网站建设(手机版网站建设)、响应式网站开发、程序开发、微网站、小程序开发等,凭借多年来在互联网的打拼,我们在互联网网站建设行业积累了丰富的网站设计制作、成都做网站、网络营销经验,集策划、开发、设计、营销、管理等多方位专业化运作于一体,具备承接不同规模与类型的建设项目的能力。

// 格式化输出:将 arg 列表中的 arg 转换为字符串输出

// 使用动词 v 格式化 arg 列表,非字符串元素之间添加空格

Print(arg列表)

// 使用动词 v 格式化 arg 列表,所有元素之间添加空格,结尾添加换行符

Println(arg列表)

// 使用格式字符串格式化 arg 列表

Printf(格式字符串, arg列表)

// Print 类函数会返回已处理的 arg 数量和遇到的错误信息。

【格式字符串】

格式字符串由普通字符和占位符组成,例如:

"abc%+ #8.3[3]vdef"

其中 abc 和 def 是普通字符,其它部分是占位符,占位符以 % 开头(注:%% 将被转义为一个普通的 % 符号,这个不算开头),以动词结尾,格式如下:

%[旗标][宽度][.精度][arg索引]动词

方括号中的内容可以省略。

【旗标】

旗标有以下几种:

空格:对于数值类型的正数,保留一个空白的符号位(其它用法在动词部分说明)。

0 :用 0 进行宽度填充而不用空格,对于数值类型,符号将被移到所有 0 的前面。

其中 "0" 和 "-" 不能同时使用,优先使用 "-" 而忽略 "0"。

【宽度和精度】

“宽度”和“精度”都可以写成以下三种形式:

数值 | * | arg索引*

其中“数值”表示使用指定的数值作为宽度值或精度值,“ ”表示使用当前正在处理的 arg 的值作为宽度值或精度值,如果这样的话,要格式化的 arg 将自动跳转到下一个。“arg索引 ”表示使用指定 arg 的值作为宽度值或精度值,如果这样的话,要格式化的 arg 将自动跳转到指定 arg 的下一个。

宽度值:用于设置最小宽度。

精度值:对于浮点型,用于控制小数位数,对于字符串或字节数组,用于控制字符数量(不是字节数量)。

对于浮点型而言,动词 g/G 的精度值比较特殊,在适当的情况下,g/G 会设置总有效数字,而不是小数位数。

【arg 索引】

“arg索引”由中括号和 arg 序号组成(就像上面示例中的 [3]),用于指定当前要处理的 arg 的序号,序号从 1 开始:

'[' + arg序号 + ']'

【动词】

“动词”不能省略,不同的数据类型支持的动词不一样。

[通用动词]

v:默认格式,不同类型的默认格式如下:

布尔型:t

整 型:d

浮点型:g

复数型:g

字符串:s

通 道:p

指 针:p

无符号整型:x

T:输出 arg 的类型而不是值(使用 Go 语法格式)。

[布尔型]

t:输出 true 或 false 字符串。

[整型]

b/o/d:输出 2/8/10 进制格式

x/X :输出 16 进制格式(小写/大写)

c :输出数值所表示的 Unicode 字符

q :输出数值所表示的 Unicode 字符(带单引号)。对于无法显示的字符,将输出其转义字符。

U :输出 Unicode 码点(例如 U+1234,等同于字符串 "U+%04X" 的显示结果)

对于 o/x/X:

如果使用 "#" 旗标,则会添加前导 0 或 0x。

对于 U:

如果使用 "#" 旗标,则会在 Unicode 码点后面添加相应的 '字符'(前提是该字符必须可显示)

[浮点型和复数型]

b :科学计数法(以 2 为底)

e/E:科学计数法(以 10 为底,小写 e/大写 E)

f/F:普通小数格式(两者无区别)

g/G:大指数(指数 = 6)使用 %e/%E,其它情况使用 %f/%F

[字符串或字节切片]

s :普通字符串

q :双引号引起来的 Go 语法字符串

x/X:十六进制编码(小写/大写,以字节为元素进行编码,而不是字符)

对于 q:

如果使用了 "+" 旗标,则将所有非 ASCII 字符都进行转义处理。

如果使用了 "#" 旗标,则输出反引号引起来的字符串(前提是

字符串中不包含任何制表符以外的控制字符,否则忽略 # 旗标)

对于 x/X:

如果使用了 " " 旗标,则在每个元素之间添加空格。

如果使用了 "#" 旗标,则在十六进制格式之前添加 0x 前缀。

[指针类型]

p :带 0x 前缀的十六进制地址值。

[符合类型]

复合类型将使用不同的格式输出,格式如下:

结 构 体:{字段1 字段2 ...}

数组或切片:[元素0 元素1 ...]

映 射:map[键1:值1 键2:值2 ...]

指向符合元素的指针:{}, [], map[]

复合类型本身没有动词,动词将应用到复合类型的元素上。

结构体可以使用 "+v" 同时输出字段名。

【注意】

1、如果 arg 是一个反射值,则该 arg 将被它所持有的具体值所取代。

2、如果 arg 实现了 Formatter 接口,将调用它的 Format 方法完成格式化。

3、如果 v 动词使用了 # 旗标(%#v),并且 arg 实现了 GoStringer 接口,将调用它的 GoString 方法完成格式化。

如果格式化操作指定了字符串相关的动词(比如 %s、%q、%v、%x、%X),接下来的两条规则将适用:

4。如果 arg 实现了 error 接口,将调用它的 Error 方法完成格式化。

5。如果 arg 实现了 string 接口,将调用它的 String 方法完成格式化。

在实现格式化相关接口的时候,要避免无限递归的情况,比如:

type X string

func (x X) String() string {

return Sprintf("%s", x)

}

在格式化之前,要先转换数据类型,这样就可以避免无限递归:

func (x X) String() string {

return Sprintf("%s", string(x))

}

无限递归也可能发生在自引用数据类型上面,比如一个切片的元素引用了切片自身。这种情况比较罕见,比如:

a := make([]interface{}, 1)

a[0] = a

fmt.Println(a)

【格式化输入】

// 格式化输入:从输入端读取字符串(以空白分隔的值的序列),

// 并解析为具体的值存入相应的 arg 中,arg 必须是变量地址。

// 字符串中的连续空白视为单个空白,换行符根据不同情况处理。

// \r\n 被当做 \n 处理。

// 以动词 v 解析字符串,换行视为空白

Scan(arg列表)

// 以动词 v 解析字符串,换行结束解析

Scanln(arg列表)

// 根据格式字符串中指定的格式解析字符串

// 格式字符串中的换行符必须和输入端的换行符相匹配。

Scanf(格式字符串, arg列表)

// Scan 类函数会返回已处理的 arg 数量和遇到的错误信息。

【格式字符串】

格式字符串类似于 Printf 中的格式字符串,但下面的动词和旗标例外:

p :无效

T :无效

e/E/f/F/g/G:功能相同,都是扫描浮点数或复数

s/v :对字符串而言,扫描一个被空白分隔的子串

对于整型 arg 而言,v 动词可以扫描带有前导 0 或 0x 的八进制或十六进制数值。

宽度被用来指定最大扫描宽度(不会跨越空格),精度不被支持。

如果 arg 实现了 Scanner 接口,将调用它的 Scan 方法扫描相应数据。只有基础类型和实现了 Scanner 接口的类型可以使用 Scan 类方法进行扫描。

【注意】

连续调用 FScan 可能会丢失数据,因为 FScan 中使用了 UnreadRune 对读取的数据进行撤销,而参数 io.Reader 只有 Read 方法,不支持撤销。比如:

go语言string之Buffer与Builder

操作字符串离不开字符串的拼接,但是Go中string是只读类型,大量字符串的拼接会造成性能问题。

拼接字符串,无外乎四种方式,采用“+”,“fmt.Sprintf()”,"bytes.Buffer","strings.Builder"

上面我们创建10万字符串拼接的测试,可以发现"bytes.Buffer","strings.Builder"的性能最好,约是“+”的1000倍级别。

这是由于string是不可修改的,所以在使用“+”进行拼接字符串,每次都会产生申请空间,拼接,复制等操作,数据量大的情况下非常消耗资源和性能。而采用Buffer等方式,都是预先计算拼接字符串数组的总长度(如果可以知道长度),申请空间,底层是slice数组,可以以append的形式向后进行追加。最后在转换为字符串。这申请了不断申请空间的操作,也减少了空间的使用和拷贝的次数,自然性能也高不少。

bytes.buffer是一个缓冲byte类型的缓冲器存放着都是byte

是一个变长的 buffer,具有 Read 和Write 方法。 Buffer 的 零值 是一个 空的 buffer,但是可以使用,底层就是一个 []byte, 字节切片。

向Buffer中写数据,可以看出Buffer中有个Grow函数用于对切片进行扩容。

从Buffer中读取数据

strings.Builder的方法和bytes.Buffer的方法的命名几乎一致。

但实现并不一致,Builder的Write方法直接将字符拼接slice数组后。

其没有提供read方法,但提供了strings.Reader方式

Reader 结构:

Buffer:

Builder:

可以看出Buffer和Builder底层都是采用[]byte数组进行装载数据。

先来说说Buffer:

创建好Buffer是一个empty的,off 用于指向读写的尾部。

在写的时候,先判断当前写入字符串长度是否大于Buffer的容量,如果大于就调用grow进行扩容,扩容申请的长度为当前写入字符串的长度。如果当前写入字符串长度小于最小字节长度64,直接创建64长度的[]byte数组。如果申请的长度小于二分之一总容量减去当前字符总长度,说明存在很大一部分被使用但已读,可以将未读的数据滑动到数组头。如果容量不足,扩展2*c + n 。

其String()方法就是将字节数组强转为string

Builder是如何实现的。

Builder采用append的方式向字节数组后添加字符串。

从上面可以看出,[]byte的内存大小也是以倍数进行申请的,初始大小为 0,第一次为大于当前申请的最大 2 的指数,不够进行翻倍.

可以看出如果旧容量小于1024进行翻倍,否则扩展四分之一。(2048 byte 后,申请策略的调整)。

其次String()方法与Buffer的string方法也有明显区别。Buffer的string是一种强转,我们知道在强转的时候是需要进行申请空间,并拷贝的。而Builder只是指针的转换。

这里我们解析一下 *(*string)(unsafe.Pointer(b.buf)) 这个语句的意思。

先来了解下unsafe.Pointer 的用法。

也就是说,unsafe.Pointer 可以转换为任意类型,那么意味着,通过unsafe.Pointer媒介,程序绕过类型系统,进行地址转换而不是拷贝。

即*A = Pointer = *B

就像上面例子一样,将字节数组转为unsafe.Pointer类型,再转为string类型,s和b中内容一样,修改b,s也变了,说明b和s是同一个地址。但是对s重新赋值后,意味着s的地址指向了“WORLD”,它们所使用的内存空间不同了,所以s改变后,b并不会改变。

所以他们的区别就在于 bytes.Buffer 是重新申请了一块空间,存放生成的string变量, 而strings.Builder直接将底层的[]byte转换成了string类型返回了回来,去掉了申请空间的操作。

排序算法(go实现)

时间:

平均O(n 2 )  最差O(n 2 )   最好O(n)

空间:

O(1)

它的工作原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。

n个记录的直接选择排序可经过n-1趟直接选择排序得到有序结果。具体算法描述如下:

时间:

平均O(n 2 )  最差O(n 2 )   最好O(n 2 )

空间:

O(1)

它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。

一般来说,插入排序都采用in-place在数组上实现。具体算法描述如下:

时间:

平均O(n 2 )  最差O(n 2 )   最好O(n)

空间:

O(1)

快速排序的基本思想: 二分递归 ,通过一趟排序将待排记录分隔成独立的两部分,其中一部分记录的关键字均比另一部分的关键字小,则可分别对这两部分记录继续进行排序,以达到整个序列有序。

快速排序使用分治法来把一个串(list)分为两个子串(sub-lists)。具体算法描述如下:

我们可以通过双指针在O(n)的时间复杂度内获取合适的 j

我们设立两个指针 i 和 j,同时设置一个标志值 arr[low],一般来说,标志值取数组第一个元素

上述算法结束之后,j 所在的位置即为我们寻找的 j

4.3 时间空间复杂度

时间:

平均O(nlog 2 n)  最差O(n 2 )   最好O(nlog 2 n)

空间:

O(1)

算法思想参考自:

golang中数组和slice作为参数的区别

最主要的区别是:slice支持负数的下标(代表从字符串结尾开始算位置),substring不支持

substring() 方法用于提取字符串中介于两个指定下标之间的字符。主要用于字符串截取

stringObject.substring(start,stop)

start:必需。一个非负的整数,规定要提取的子串的第一个字符在 stringObject 中的位置。

end:可选。一个非负的整数,比要提取的子串的最后一个字符在 stringObject 中的位置多 1。

如果省略该参数,那么返回的子串会一直到字符串的结尾。

例如:"abcdefg".substring(3,5)返回de,字符串的第3个字符是d(从0开始,即a是第0个字符),截取到第5个字符前(不包括第5个)

与 slice()方法不同的是,substring() 不接受负的参数。

slice() 方法可提取字符串的某个部分,并以新的字符串返回被提取的部分。

stringObject.slice(start,end)

start:要抽取的片断的起始下标。如果是负数,则该参数规定的是从字符串的尾部开始算起的位置。也就是说,-1 指字符串的最后一个字符,-2 指倒数第二个字符,以此类推。

end:紧接着要抽取的片段的结尾的下标。若未指定此参数,则要提取的子串包括 start 到原字符串结尾的字符串。如果该参数是负数,那么它规定的是从字符串的尾部开始算起的位置。

slice() 比 substring() 要灵活一些,因为它允许使用负数作为参数。

JAVA String 如何去掉指定字符

用replaceAll方法将需要去掉的部分替换成空字符串就可以了

replaceAll

public String replaceAll(String regex,

String replacement)

使用给定的 replacement 替换此字符串所有匹配给定的正则表达式的子字符串。

调用此方法的 str.replaceAll(regex,

repl) 形式与以下表达式产生的结果完全相同:

Pattern.compile(regex).matcher(str).replaceAll(repl)

注意,在替代字符串中使用反斜杠 (\) 和美元符号 ($) 与将其视为字面值替代字符串所得的结果可能不同;请参阅 Matcher.replaceAll。如有需要,可使用

Matcher.quoteReplacement(java.lang.String)

取消这些字符的特殊含义。

参数:

regex - 用来匹配此字符串的正则表达式

replacement - 用来替换每个匹配项的字符串

返回:

所得 String

抛出:

PatternSyntaxException

- 如果正则表达式的语法无效

从以下版本开始:

1.4

另请参见:

Pattern


名称栏目:go语言如何去掉部分字串,go 字符串替换
文章URL:http://cdxtjz.cn/article/phcchi.html

其他资讯