Java charAt()还是substring?哪个更快?

tag5nh1u  于 2023-04-19  发布在  Java
关注(0)|答案(6)|浏览(248)

我想遍历String中的每个字符,并将String中的每个字符作为String传递给另一个函数。

String s = "abcdefg";
for(int i = 0; i < s.length(); i++){
    newFunction(s.substring(i, i+1));}

String s = "abcdefg";
for(int i = 0; i < s.length(); i++){
    newFunction(Character.toString(s.charAt(i)));}

最后的结果必须是一个String。
那么,有什么想法会更快或更有效吗?

xriantvc

xriantvc1#

像往常一样:这没关系,但如果你坚持花时间在微优化上,或者如果你真的喜欢为你的非常特殊的用例进行优化,试试这个:

import org.junit.Assert;
import org.junit.Test;

public class StringCharTest {

    // Times:
    // 1. Initialization of "s" outside the loop
    // 2. Init of "s" inside the loop
    // 3. newFunction() actually checks the string length,
    // so the function will not be optimized away by the hotstop compiler

    @Test
    // Fastest: 237ms / 562ms / 2434ms
    public void testCacheStrings() throws Exception {
        // Cache all possible Char strings
        String[] char2string = new String[Character.MAX_VALUE];
        for (char i = Character.MIN_VALUE; i < Character.MAX_VALUE; i++) {
            char2string[i] = Character.toString(i);
        }

        for (int x = 0; x < 10000000; x++) {
            char[] s = "abcdefg".toCharArray();
            for (int i = 0; i < s.length; i++) {
                newFunction(char2string[s[i]]);
            }
        }
    }

    @Test
    // Fast: 1687ms / 1725ms / 3382ms
    public void testCharToString() throws Exception {
        for (int x = 0; x < 10000000; x++) {
            String s = "abcdefg";
            for (int i = 0; i < s.length(); i++) {
                // Fast: Creates new String objects, but does not copy an array
                newFunction(Character.toString(s.charAt(i)));
            }
        }
    }

    @Test
    // Very fast: 1331 ms/ 1414ms / 3190ms
    public void testSubstring() throws Exception {
        for (int x = 0; x < 10000000; x++) {
            String s = "abcdefg";
            for (int i = 0; i < s.length(); i++) {
                // The fastest! Reuses the internal char array
                newFunction(s.substring(i, i + 1));
            }
        }
    }

    @Test
    // Slowest: 2525ms / 2961ms / 4703ms
    public void testNewString() throws Exception {
        char[] value = new char[1];
        for (int x = 0; x < 10000000; x++) {
            char[] s = "abcdefg".toCharArray();
            for (int i = 0; i < s.length; i++) {
                value[0] = s[i];
                // Slow! Copies the array
                newFunction(new String(value));
            }
        }
    }

    private void newFunction(String string) {
        // Do something with the one-character string
        Assert.assertEquals(1, string.length());
    }

}
sigwle7e

sigwle7e2#

答案是:it doesn't matter
分析你的代码。这是你的瓶颈吗?

epggiuax

epggiuax3#

newFunction真的需要取一个String吗?如果你能让newFunction取一个char并这样调用它会更好:

newFunction(s.charAt(i));

这样,就避免了创建临时String对象。
回答你的问题:很难说哪一个更有效率。在这两个例子中,必须创建一个只包含一个字符的String对象。哪个更有效取决于String.substring(...)Character.toString(...)在特定Java实现中的实现方式。唯一的方法是通过分析器运行程序,看看哪个版本使用更多的CPU和/或更多的内存。通常,您不应该担心像这样的微优化-只有当您发现这是性能和/或内存问题的原因时,才应该在这方面花费时间。

6mw9ycah

6mw9ycah4#

我同意Will的观点,它几乎肯定与代码的整体性能无关-如果不是,你可以自己做些改变,并确定在硬件上使用JVM时哪一个对数据来说是最快的。
也就是说,如果首先将String转换为char数组,然后对数组执行迭代,那么第二个代码片段可能会更好(转换成数组)而不是每次调用。另外,你可以直接把数组和一些索引一起传递给String构造函数,这比从数组中取出一个char out 来单独传递它(然后变成一个字符数组)更有效:

String s = "abcdefg";
char[] chars = s.toCharArray();
for(int i = 0; i < chars.length; i++) {
    newFunction(String.valueOf(chars, i, 1));
}

但是为了强调我的第一点,当你看到你在每次调用String.charAt()时实际上避免了什么-它是两个边界检查,一个(惰性)布尔OR和一个加法。这不会产生任何明显的差异。String构造函数的差异也是如此。
从本质上讲,这两种习惯用法在性能方面都很好(两者都不是立即明显低效的),所以你不应该花更多的时间来处理它们,除非分析器显示这占用了你应用程序的大量运行时。即使这样,你几乎可以肯定通过在这方面重新构造你的支持代码来获得更多的性能提升(例如,让newFunction自己处理整个字符串);String在这一点上得到了很好的优化。

pokxtpni

pokxtpni5#

我首先使用String.toCharArray()从源String获取底层char[],然后继续调用newFunction。
但我同意Jesper的观点,如果你能只处理字符,避免所有的字符串函数,那将是最好的。

1sbrub3j

1sbrub3j6#

Leetcode似乎更喜欢子字符串选项here
我是这样解决这个问题的:

class Solution {
public int strStr(String haystack, String needle) {
    if(needle.length() == 0) {
        return 0;
    }

    if(haystack.length() == 0) {
        return -1;
    }

    for(int i=0; i<=haystack.length()-needle.length(); i++) {
        int count = 0;
        for(int j=0; j<needle.length(); j++) {
            if(haystack.charAt(i+j) == needle.charAt(j)) {
                count++;
            }
        }
        if(count == needle.length()) {
            return i;
        }
    }
    return -1;
}

}
这是他们给予的最优解:

class Solution {
public int strStr(String haystack, String needle) {
    int length;
    int n=needle.length();
    int h=haystack.length();
    if(n==0)
        return 0;
    // if(n==h)
    //     length = h;
    // else
        length = h-n;
    if(h==n && haystack.charAt(0)!=needle.charAt(0))
            return -1;
    for(int i=0; i<=length; i++){
        if(haystack.substring(i, i+needle.length()).equals(needle))
            return i;
    }
    return -1;
}

}
说实话我不知道这有什么关系

相关问题