Effective Java - Item 6

Updated:

Effective Java

Item 6. 불필요한 객체 생성을 피하라

불필요한 객체 생성

똑같은 기능의 객체를 매번 생성하기 보다는 객체 하나를 재사용하는 편이 나을 때가 많다.
재사용은 빠르고 세련된다. 특히 불변(Immutable) 객체는 언제든 재사용할 수 있다.

String s = new String("bikini");  // 하지 말아야 할 극단적 예시

이 문장은 실행될 때마다 String 인스턴스를 새로 만든다. 완전히 쓸데없는 행위다.
생성자에 넘겨진 “bikini” 자체가 이 생성자로 만들어내려는 String과 기능적으로 동일하므로, 반복문이나 빈번히 호출되는 메서드 안에 있다면 쓸데없는 String 인스턴스가 수백만 개 만들어 질 수 있다.

String s = "bikini"  // 개선된 버전

이 코드는 새하나의 String 인스턴스를 사용한다.
이 방식을 사용한다면 같은 가상 머신 안에서 이와 똑같은 문자열 리터럴을 사용하는 모든 코드가 같은 객체를 재사용함이 보장된다.

불필요한 객체 생성 방지

생성자 대신 정적 팩터리 메서드를 제공하는 불변 클래스에서는 정적 팩터리 메서드를 사용해 불필요한 객체 생성을 피할 수 있다.
Ex) Boolean(String) 생성자 대신, Boolean.valueOf(String) 팩터리 메서드 사용
생성자는 호출할 때마다 새로운 객체를 만들지만, 팩터리 메서드는 전혀 그렇지 않다.
가변 객체라도 사용 중에 변경 되지 않을 것임을 안다면 재사용 할 수 있다.

생성 비용이 비싼 객체

생성 비용이 아주 비싼 객체도 더러 있다. 객체 풀을 만들어 재사용하는 데이터베이스 커넥션이 하나의 예다.
이런 ‘비싼 객체’가 반복해서 필요하다면 캐싱하여 재사용하길 권한다.

불필요한 객체 생성 반복 예시 1

static boolean isRomanNumeral(String s) {
    return s.matches("^(?=.)M*(C[MD]|D?C{0,3})"
      + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");
}

위는 주어진 문자열이 유효한 로마 숫자인지를 확인하는 메서드며, 정규표현식을 활용하였다.
이 방식의 문제는 String.matches 메서드를 사용하는 데 있다.
String.matches는 정규표현식으로 문자열 형태를 확인하는 가장 쉬운 방법이지만, 성능이 중요한 상황에서 반복해 사용하기엔 적합하지 않다.
이 메서드가 내부에서 만드는 정규표현신용 Pattern 인스턴스는, 한 번 쓰고 버려져서 곧바로 GC 대상이 되며, 입력받은 정규표현식에 해당하는 유한 상태 머신(finite state machine)을 만들기 때문에 인스턴스 생성 비용이 높다.

public class RomanNumerals {    // 메서드 대신 Class로 선언한다
    private static final Pattern ROMAN = Pattern.compile( //Pattern 인스턴스를 끄집어 낸다
      "^(?=.)M*(C[MD]|D?C{0,3})" 
      + "(X[CL]|L?X{0,3})(I[XV]|V?I{0,3})$");

    static boolean isRomanNumeral(String s) {
      return ROMAN.matcher(s).matches();
    }
}

성능을 개선한 방식이다. Pattern 인스턴스를 클래스 초기화(정적 초기화)과정에서 직접 생성해 캐싱해두고, 나중에 isRomanNumeral 메서드가 호출될 때마다 이 인스턴스를 재사용한다.

이렇게 개선하면 isRomanNumeral가 빈번히 호출되는 상황에서 성능을 상당히 끌어올릴 수 있다.
또한 코드도 더 명확해 졌다. 존재조차 몰랐던 Pattern 인스턴스를 static final 필드로 끄집어내고 이름을 지어주어 코드의 의미가 훨씬 잘 드러난다.

단점

위 클래스가 초기화된 후 이 메서드를 한 번도 호출하지 않는다면, ROMAN 필드는 쓸데없이 초기화 된다.
메서드가 처음 호출될 때 필드를 초기화하는 지연 초기화(lazy initialization)(item 83)로 개선할 수 있지만, 권하지는 않는다.
코드가 복잡해지는데, 성능은 크게 개선되지 않을 때가 많기 때문이다(item 67).

불필요한 객체 생성 반복 예시 2

Map 인터페이스의 keySet 메서드는 Map 객체 안의 Key 전부를 담은 Set 뷰를 반환한다.
keySet을 호출할 때마다 새로운 Set 인스턴스가 만들어질 것이라고 생각 되지만, 매번 같은 Set 인스턴스를 반환한다.
반환된 Set 인스턴스가 일반적으로 가변이더라도 반환된 인스턴스들은 기능적으로 모두 똑같다.

import java.util.*;
public class keySet_of_Map_instanceTest {
	
	public static void main(String[] args) {
		Map<Integer, Character> map = new HashMap<>();
		map.put(1, 'a');
		map.put(2, 'b');
		map.put(3, 'c');
		map.put(4, 'd');
		map.put(5, 'e');
		
		Set<Integer> keyset1 = map.keySet();
		Set<Integer> keyset2 = map.keySet();
		
		System.out.println("keyset is same?: " + (keyset1 == keyset2));
		
    // keyset1,2 각각 제거를 하면 결과는 함께 제거된다.
		keyset1.remove(1);    
		keyset2.remove(2);    
		
		for(int v : keyset2)
			System.out.print(v + " ");
	}
}

즉, 반환한 객체 중 하나를 수정하면 다른 모든 객체가 따라서 바뀐다.
모두가 똑같은 Map 인스턴스를 대변하기 때문이다. 따라서 keySet으로 뷰 객체를 여러개 만들 필요가 없다.

불필요한 객체 생성 반복 예시 3

마지막 예는, 오토박싱(auto boxing)을 들 수 있다.
오토박싱은 프로그래머가 기본 타입과 박싱된 기본 타입을 섞어 쓸 때, 자동으로 상호 변환해주는 기술이다.
오토 박싱은 기본 타입과 그에 대응하는 박싱된 기본 타입의 구분을 흐려주지만, 완전히 없애주는 것은 아니다!

private static long sum(){
  Long sum = 0L;    // boxing 된 타입
  for(long i = 0; i <= Integer.MAX_VALUE; i++)
    sum += i;   // 끔직히 느리다!!
  return sum
}

위 예시는 boxing 된 long 객체에 long 값을 더해준다. 위 예시는 기본 타입끼리의 연산보다 훨씬 느린데, 이 이유는
sum 변수를 Long으로 선언하여 불필요한 Long 인스턴스가 231개나 만들어진 것이다.
박싱된 기본 타입보다는 기본 타입을 사용하고, 의도치 않은 오토박싱이 숨어들지 않도록 주의하자.

정리

이번 아이템을 “객체 생성은 비싸니 피해야 한다”로 오해하면 안된다.
최근 JVM의 GC는 상당히 잘 최적화 되어있다. 따라서 최근 JVM에서는 작은 객체를 생성하고 회수하는 일이 크게 부담되지 않으므로, 프로그램의 명확성, 간결성, 기능을 위해서 객체를 추가로 생성해도 된다.
즉, 아주 무거운 객체가 아니면 단순히 객체 생성을 피하고자 각자의 객체 풀(pool)을 만들지 말라.
자체 객체 풀은 코드를 헷갈리게 만들고, 메모리 사용량을 늘려 성능을 떨어뜨린다.

이번 아이템은 방어적 복사(item 50)과 대조적이다.
item 50은 “새로운 객체를 만들어야 한다면 기존 객체를 재사용하지 말라” 인데, 방어적 복사가 필요한 상황에서 객체를 재사용했을 때 피해가 객체를 반복 생성했을 때의 피해보다 훨씬 크다.
방어적 복사에 실패하면 언제 터져나올지 모르는 버그와 보안 구멍으로 이어지지만, 불필요한 객체 생성은 그저 성능에만 영향을 준다.

출처

Joshua Bloch. Effective Java 3/E. n.p.: 인사이트, 2018년 11월 1일.