字符串

从概念上讲,Java字符串就是Unicode字符序列。例如,字符串"Java\u2122"由5个Unicode字符Java组成。Java没有内置的字符串类型,而是在标准Java类库中提供了一个预定义类,很自然地叫做String。每个双引号括起来的字符串都是String类中的一个实例

String e = "";  // an empty string
String greeting = "Hello"

子串

String类的substring方法返回字符串的子字符串。语法

public String substring(int beginIndex)

或

public String substring(int beginIndex, int endIndex)

参数

  • beginIndex -- 起始索引(包括), 索引从 0 开始。
  • endIndex -- 结束索引(不包括)

例子

public class FirstSample {
    public static void main(String[] args) {
        String Str = "This is text";

        System.out.print("返回值 :" );
        System.out.println(Str.substring(4) );  // 从第4个索引开始到结束

        System.out.print("返回值 :" );
        System.out.println(Str.substring(4, 10) );  // 从第4个索引开始到第10个结束,不包括第10个
    }
}

结果

返回值 : is text
返回值 : is te

现在我们知道了substring的用法,接下来看看源码

源码分析

/**
     * Returns a string that is a substring of this string. The
     * substring begins at the specified {@code beginIndex} and
     * extends to the character at index {@code endIndex - 1}.
     * Thus the length of the substring is {@code endIndex-beginIndex}.
     * <p>
     * Examples:
     * <blockquote><pre>
     * "hamburger".substring(4, 8) returns "urge"
     * "smiles".substring(1, 5) returns "mile"
     * </pre></blockquote>
     *
     * @param      beginIndex   the beginning index, inclusive.
     * @param      endIndex     the ending index, exclusive.
     * @return     the specified substring.
     * @exception  IndexOutOfBoundsException  if the
     *             {@code beginIndex} is negative, or
     *             {@code endIndex} is larger than the length of
     *             this {@code String} object, or
     *             {@code beginIndex} is larger than
     *             {@code endIndex}.
     */
    // 定义了substring方法,有两个参数beginIndex和endIndex
    public String substring(int beginIndex, int endIndex) {
        // 如果起始索引小于0,抛出异常
        if (beginIndex < 0) {
            throw new StringIndexOutOfBoundsException(beginIndex);
        }
        // 如果结束索引大于值的长度,抛出异常
        if (endIndex > value.length) {
            throw new StringIndexOutOfBoundsException(endIndex);
        }
        // 子串的长度
        int subLen = endIndex - beginIndex;
        // 如果子串的长度小于0,抛出异常
        if (subLen < 0) {
            throw new StringIndexOutOfBoundsException(subLen);
        }
        // 如果起始索引等于0并且结束索引等于字符串的长度,那么返回字符串本身,否则创建一个新的字符串
        return ((beginIndex == 0) && (endIndex == value.length)) ? this
                : new String(value, beginIndex, subLen);
    }

拼接

与绝大多数程序设计语言一样,Java语言允许使用+号连接(拼接)两个字符串。这个没什么说的。
但是要注意:当将一个个字符串与一个非字符串的值进行拼接时,后者会转换字符串。例如:

int age = 13;
String x = "jkc" + age;

结果是jkc13

如果我们需要把多个字符串放在一起,并用一个界定符分隔,可以使用静态join方法:

public class FirstSample {
    public static void main(String[] args) {
        System.out.print("返回值 :" );
        System.out.println(String.join("/", "A", "B", "C", "D"));
    }
}

结果

返回值 :A/B/C/D

join方法有两种重载方法,这里只介绍以下这一种

public static String join(CharSequence delimiter, CharSequence… elements)
  • delimiter:字符串分隔符
  • ...elements:指定的字符串

String.join("/", "A", "B", "C", "D")的意思就是用分隔符/将ABCD这4个字符串连接起来,结果自然就是A/B/C/D

不可变字符串

在Java中是不能修改Java字符串中的单个字符的,所以再Java文档中将String类对象称为是不可变的,如果真的想修改,可以提取想保留的子串,再与希望替换的字符拼接:

greeting = greeting.substring(0, 3) + "p!";

检测字符串是否相等

可以使用equals方法检测两个字符串是否相等,语法:

s.equals(t)

如果字符串s与字符串t相等,则返回true;否则,返回false。
要想检测两个字符串是否相等,而不区分大小写,可以使用equalsIsIgnoreCase方法。

"Hello".equalsIgnoreCase("hello");

注意:一定不要使用==运算符检测两个字符串是否相等!这个运算符只能够确定两个字符串是否在同一个内存地址上。当然,如果字符串在同一个内存地址上,它们必然相等。但是,完全有可能将内容相同的多个字符串放置在不同的内存地址上。

public class FirstSample {
    public static void main(String[] args) {
        String greeting = "Hello";
        System.out.println("变量greeting的内存地址为:" + System.identityHashCode(greeting));
        System.out.println("hello的内存地址为:" + System.identityHashCode(greeting));
        if (greeting == "Hello") {
            System.out.println("同一个内存地址,相等");
        }
        String x =  greeting.substring(0, 3);
        System.out.println("变量x的内存地址:" + System.identityHashCode(x));
        if (x == "Hel") {
            System.out.println("内存地址不同");
        }
    }
}

如果虚拟机始终将相同的字符串共享,就可以使用==运算符检测是否相等。但实际上只有字符串字面量是共享的,而+substring等操作得到的字符串并不共享。因此,千万不要使用==运算符测试字符串的相等性,以免在程序中出现这种最糟糕的bug,看起来这种bug就像随机产生过的间歇性错误。

空串与Null串

空串""是长度为0的字符串。可以调用以下代码检查一个字符串是否为空:

if (str.length() == 0)

if (str.equals(""))

空串是一个Java对象,有自己的串长度(0)和内容(空)。不过String变量还可以存放一个特殊的值,名为null,表示目前没有任何对象与该变量关联。要检查一个字符串是否为null,要使用以下条件:

if (str == null)

有时要检查一个字符串既不是null也不是空串,这种情况下就需要使用以下条件:

if (str !=null && str.length() != 0)

首先要检查str不为null,如果在一个null值上调用方法,会出现错误。

String API

Java中的String类包含了50多个方法,接下来介绍一些最常用的方法

java.lang.String 1.0

  • char charAt(int index)
    返回给定位置的代码单元。除非对底层的代码单元感兴趣,否则不需要调用这个方法。
  • int codePointAt(int index)
    返回从给定位置开始的码点。
  • int offsetByCodePoints(int startIndex, int cpCount)
    返回从startIndex码点开始,cpCount个码点后的码点索引。
  • int compareTo(String other)
    按照字典顺序,如果字符串位于other之前,返回一个负数;如果字符串位于other之后,返回一个正数;如果两个字符串相等,返回0.
  • IntStream codePoints()
    将这个字符串的码点作为一个流返回。调用toArray将它们放在一个数组中
  • new String(int[] codePoints, int offset, int count)
    用数组中从offset开始的count个码点构造一个字符串。
  • boolean isEmpty()
    如果字符串为空,返回true
  • boolean equals(Object other)
    如果字符串与other相等,返回true
  • boolean equalsIgnoreCase(String other)
    如果字符串与other相等(忽略大小写),返回true
  • boolean startsWith(string prefix)
    判断字符串是否是以prefix前缀开始
  • boolean endsWith(String suffix)
    判断字符串是否是以suffix后缀开始
  • int indexOf(String str)
  • int indexOf(String str, int fromIndex)
  • int indexOf(int cp)
  • int indexOf(int cp, int fromIndex)
    返回与字符串str或码点cp匹配的第一个子串的开始位置。从索引0或fromIndex开始匹配。如果在原始字符串中不存在str,则返回-1
  • int lastIndexOf(String str)
  • int lastIndexOf(String str, int fromIndex)
  • int lastIndex(int cp)
  • int lastIndex(int cp, int fromIndex)
    返回与字符串str或码点cp匹配的最后一个子串的开始位置。从原始字符串末尾或fromIndex开始匹配。
  • int length()
    返回字符串代码单元的个数
  • int codePointCount(int startIndex, int endIndex)
    返回startIndexendIndex-1之间的码点个数
    String replace(CharSequence oldString, CharSequence newString)
    返回一个新字符串。这个字符串用newString代替原始字符串中所有的oldString。可以用StringStringBuilder对象作为CharSequence参数。
  • String substring(int beginIndex)
  • String substring(int beginIndex, int endIndex)
    返回一个新字符串。这个字符串包含原始字符串中从beginIndex到字符串末尾或endIndex-1的所有代码单元
  • String toLowerCase()
  • String toUppCase()
    返回一个新字符串。这个字符串将原始字符串中的大写字母改成小写,或者将原始字符串中的所有小写字母改成大写。
  • String trim()
  • String strip() 11
    返回一个新字符串。这个字符串将删除原始字符串头部和尾部小于等于U+0020的字符(trim)或空格(strip)。
  • String join(CHarSequence delimiter, CharSequence... elements)
    返回一个新字符串,用给定的定界符连接所有元素
  • String repeat(int count) 11
    返回一个字符串,将当前字符串重复count次

构建字符串

  有些时候,需要由较短的字符串构建字符串,例如,按键或来自文件中的单词。如果采用字符串拼接的方式来达到这个目的,效率会比较低。每次拼接字符串时,都会构建一个新的String对象,既耗时,又浪费空间。使用StringBuilder类就可以避免这个问题发生。
  如果需要用许多小段的字符串来构建一个字符串,那么应该按照下列步骤进行。首先,构建一个空的字符串构建器:

StringBuilder builder = new StringBuilder();

当每次需要添加一部分内容时,就调用append方法

builder.append("jkc");
builder.append("jkc2");
builder.append("jkc3");

在字符串构建完成时就调用toString方法,将可以得到一个String对象,其中包含了构建器中的字符序列。

String completedString = builder.toString();

下面的API包含了StringBuilder类中的重要方法

  • StringBuilder()
    构造一个空的字符串构建器
  • int length()
    返回构建器或缓冲器中的代码单元数量
  • StringBuilder append(String str)
    追加一个字符串并返回this
  • StringBuilder append(char c)
    追加一个代码单元并返回this
  • StringBuilder appendCodePoint(int cp)
    追加一个码点,并将其转换为一个或两个代码单元并返回this
  • void setCharAt(int i, char c)
    将第i个代码单元设置为c
  • StringBuilder insert(int offset, String str)
    offset位置插入一个字符串并返回this
  • StringBuilder insert(int offset, char c)
    offset位置插入一个代码单元并返回this
  • StringBuilder delete(int startIndex, int endIndex)
    删除偏移量从startIndexendIndex-1的代码单元并返回this
  • String toString()
    返回一个与构建器或缓冲器内容相同的字符串