String类位于java.lang包下,是Java语言的核心类,提供了字符串的比较、查找、截取、大小写转换等操作,可以使用“+”连接其他对象,String类的部分源码如下
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** The value is used for character storage. */
private final char value[];
/** Cache the hash code for the string */
private int hash; // Default to 0
...
}
从上面可以看出
字符串连接是通过 StringBuilder(或 StringBuffer)类及其append 方法实现的,对象转换为字符串是通过 toString 方法实现的,该方法由 Object 类定义,并可被 Java 中的所有类继承。
我们可以通过反编译验证一下:
public class Test {
public static void main(String[] args) {
int i = 10;
String s = "哪吒";
System.out.println(s + i);
}
}
/**
* 反编译后
*/
public class Test {
public static void main(String args[]) {
...
byte byte0 = 10;
String s = "哪吒";
System.out.println((new StringBuilder()).append(s).append(byte0).toString());
}
}
从上面的代码就可以看出“+”连接字符串的底层,实际上就是StringBuilder对象通过append,再调用toString完成的。
使用“+”连接符时,JVM会隐式的创建StringBuilder对象,这种方式在大部分情况下不会造成效率的损失,但是,在循环中进行字符串拼接时就不一样了。
因为会创建大量的StringBuilder对象在堆内存中,这肯定是不允许的,所以这时就建议在循环外创建一个StringBuilder对象,然后循环内调用append方法进行手动拼接。
还有一种特殊情况,如果“+”拼接的是字符串常量中的字符串时,编译器会进行优化,直接将两个字符串常量拼接好。
所以,“+”连接符对于直接相加的字符串常量效率很高,因为在编译期间便确定了它的值;但对于间接相加的情况效率就会变低,建议单线程时使用StringBuilder,多线程时使用StringBuffer替代。
import java.util.ArrayList;
import java.util.List;
import java.util.StringJoiner;
public class StringTest {
private static void test01() {
String str = "哪吒,";
String ret = "";
System.out.println("+字符串拼接开始...");
long start = System.currentTimeMillis();
// + 在循环中的效率太低,用10万条测试吧
for (int i = 0; i < 100000; i++) {
ret += str;
}
long end = System.currentTimeMillis();
System.out.println("+号拼接10万条数据耗时:"+(end-start)+"ms");//18288ms
System.out.println("************");
}
private static void test02() {
String str = "哪吒,";
StringBuilder builder = new StringBuilder();
System.out.println("StringBuilder,字符串拼接开始...");
long start = System.currentTimeMillis();
for (int i = 0; i < 10000000; i++) {
builder.append(str);
}
long end = System.currentTimeMillis();
System.out.println("StringBuilder拼接1000万条数据耗时:"+(end-start)+"ms");//168ms,173ms,239ms
System.out.println("************");
}
private static void test03() {
String str = "哪吒,";
StringBuffer buffer = new StringBuffer();
System.out.println("StringBuffer,字符串拼接开始...");
long start = System.currentTimeMillis();
for (int i = 0; i < 10000000; i++) {
buffer.append(str);
}
long end = System.currentTimeMillis();
System.out.println("StringBuffer拼接1000万条数据耗时:"+(end-start)+"ms");//527ms,343ms,398ms
System.out.println("************");
}
/**
* StringJoiner的效率明显高于List + StringJoiner
*/
private static void test04() {
String str = "哪吒";
StringJoiner join = new StringJoiner(",");
System.out.println("StringJoiner,字符串拼接开始...");
long start = System.currentTimeMillis();
for (int i = 0; i < 10000000; i++) {
join.add(str);
}
long end = System.currentTimeMillis();
System.out.println("StringJoiner拼接1000万条数据耗时:"+(end-start)+"ms");//184ms,316ms,243ms
System.out.println("************");
}
private static void test05() {
String str = "哪吒";
List<String> list = new ArrayList<String>();
System.out.println("List + StringJoiner,字符串拼接开始...");
long start = System.currentTimeMillis();
for (int i = 0; i < 10000000; i++) {
list.add(str);
}
String ret = String.join(",", list);
long end = System.currentTimeMillis();
System.out.println("List + StringJoiner拼接1000万条数据耗时:"+(end-start)+"ms");//563ms,477ms,585ms
System.out.println("************");
}
public static void main(String[] args) {
test02();
}
}
总结:StringBuilder效率最高,+拼接效率最低。
StringBuilder的源码
@Override
public StringBuilder append(char[] str) {
super.append(str);
return this;
}
StringBuilder继承AbstractStringBuilder
类
public final class StringBuilder
extends AbstractStringBuilder
implements java.io.Serializable, CharSequence
{
...
}
public AbstractStringBuilder append(String str) {
if (str == null)
return appendNull();
int len = str.length();
ensureCapacityInternal(count + len);
str.getChars(0, len, value, count);
count += len;
return this;
}
append会直接拷贝字符到内部的字符数组中,如果字符数组长度不够,会进行扩展。
StringBuffer和StringBuilder的情况类似,只不过StringBuffer是线程安全的而已。
常量池在java用于保存在编译期已确定的,已编译的class文件中的一份数据。它包括了关于类,方法,接口等中的常量,也包括字符串常量,如String s = "java"这种申明方式;当然也可扩充,执行器产生的常量也会放入常量池,故认为常量池是JVM的一块特殊的内存空间。
字符串的对象分配是需要消耗大量的时间和空间的,而且字符串使用的非常多,很多初级程序员,会将所有的变量都定义为String,不知你年轻的时候是不是这样,哈哈。
JVM为了提高性能和减少内存的开销,在实例化字符串的时候进行了一系列的优化,那就是字符串常量池。JVM会先检查字符串常量池,如果已经存在,就直接返回字符串常量池中的实例引用,如果不存在,就会实例化该字符串并将其放到字符串常量池中。由于String的不可变性,常量池中一定不存在两个相同的字符串。
在HotSpot VM中字符串常量池是通过一个StringTable类实现的,它是一个Hash表,默认值大小长度是1009;这个StringTable在每个HotSpot VM的实例中只有一份,被所有的类共享;字符串常量由一个一个字符组成,放在了StringTable上。要注意的是,如果放进String Pool的String非常多,就会造成Hash冲突严重,从而导致链表会很长,而链表长了后直接会造成的影响就是当调用String.intern时性能会大幅下降。
public class StringTest {
public static void main(String[] args) {
// 1. 新建一个引用s1指向堆中的对象s1,值为"CSDN哪吒"
String s1=new String("CSDN")+new String("哪吒");
// 2. 新建一个引用s2指向堆中的对象s2,值为"CSDN哪吒"
String s2=new String("CS")+new String("DN哪吒");
// 3. 执行s1.intern()会在字符串常量池中新建一个引用"CSDN哪吒",该引用指向s1在堆中的地址,并新建一个引用s3指向字符串常量池中的"CSDN哪吒"
String s3=s1.intern();
// 4. 执行s2.intern()不会在字符串常量池中创建新的引用,因为"CSDN哪吒"已存在,因此只执行了新建一个引用s4指向字符串常量池中"CSDN哪吒"的操作
String s4=s2.intern();
// s3和s4指向的都是字符串常量池中的"CSDN哪吒",而这个"CSDN哪吒"都指向堆中s1的地址
System.out.println(s1==s3); // true
System.out.println(s1==s4); // true
// s3和s4最终关联堆中的地址是对象s1
System.out.println(s2 == s3);// false
System.out.println(s2 == s4);// false
}
}
直接使用双引号声明出来的String对象会直接存储在字符串常量池中,如果不是用双引号声明的String对象,可以使用String提供的intern方法。intern 方法是一个native方法,intern方法会从字符串常量池中查询当前字符串是否存在,如果存在,就直接返回当前字符串;如果不存在就会将当前字符串放入常量池中,之后再返回。
JDK1.7的改动:
版权说明 : 本文为转载文章, 版权归原作者所有 版权申明
原文链接 : https://blog.csdn.net/guorui_java/article/details/120240687
内容来源于网络,如有侵权,请联系作者删除!