2017.03.31

프로그래머들이 스스로에게 하는 9가지 거짓말

Peter Wayner | InfoWorld

프로그래머들은 자부심을 갖고 있다. 나쁘게 말하면 교만하다. 그도 그럴 것이 다른 사람들에게는 데이터베이스에 손을 뻗어 현실을 바꿀 힘이 없다. 세상이 작동하는 방식을 정립하기 위해 컴퓨터에 더 많이 의지할수록 프로그래머의 영향력도 커진다.

그러나 '교만'은 '나락'의 선봉이다. 우리 모두가 공유하는 힘은 진짜이다. 그러나 절대적인 힘은 아니며, 때론 공허하다. 사실 항상 공허하다. 완벽한 코드란 존재하지 않기 때문이다. 때론 행운을 빌고, 한계를 정한다. 컴퓨터는 실수를 하기 때문이다. 컴퓨터에 지나칠 정도로 많은 오류가 발생할 수 있다. 우리 모두 직접 경험해 잘 알고 있는 사실이다.

물론 프로그래머들의 잘못된 가정이 초래한 문제는 정말 많다. 프로그래머의 가정은 보통 한 때는 진실이지만, 언제까지나 진실인 것은 아니다. 마크 트웨인은 "뭔가를 몰라서가 아니라, 뭔가를 확실히 안다고 착각해 곤경에 빠진다."고 말했다.

케빈 델디케(Kevin Deldycke)가 기트허브(GitHub)에 올린 '프로그래머들이 철석 같이 믿는 착각' 목록은 사이버공간과 현실이 얼마나 동떨어져 있는지 보여준다. 이는 다른 사람들이 계속 추가하면서 항목이 계속 늘어날 그런 목록이다. 'Remember, Caesar, thou art mortal(황제여, 당신도 필멸의 존재라는 점을 명심하라!)'에 해당하는 수 많은 사례를 멋지게 정리한 목록이다.

필자가 가장 좋아하는 항목은 전화번호에 대한 착각이다. 특정 전화번호를 저장하는 것이 7자리 또는 10자리의 번호를 데이터베이스에 입력하는 간단한 일이라고 생각할지 모르겠다. 그러나 이는 착각이다. 국가 코드, 사용하지 않는 번호 등 전화번호를 계속 기록하는 것을 어렵게 만드는 요소가 10여 개에 달한다. 작은 검은색 책자에 전화번호를 적어놓는 러다이트(Luddite)는 얼굴에 만족스러운 미소를 짓고 있을 것이다.

프로그래머들이 사실이라고 확신하는 착각들을 정리해봤다.

질문들의 답은 하나이다.
데이터베이스 테이블은 컬럼으로 가득하고, 각 컬럼에는 정보가 입력되어 있거나 입력되어 있지 않다. 또 가득 차 있거나 비어 있다. 모든 질문에 대한 하나의 답을 찾기가 어려운 이유는 무엇일까?

때론 답이 하나 이상이기 때문이다. 이 경우, 테이블이 문제를 일으키기 시작한다. 한 사람이 별장 전화번호 등 하나 이상의 전화번호를 가지고 있을 수 있다. 데이터베이스 설계자는 여러 답을 저장할 수 있는 다대일, 일대다 매핑으로 이에 대한 해결책을 찾았다. 최신 NoSQL 솔루션은 여러 태그를 첨부한 가능성이 있는 답들을 하나로 통합하는 도큐먼트 모델을 이용한다.

훨씬 더 나은 솔루션이지만, 이 또한 한계를 갖고 있다. 짧은 시간 동안에만 유효한 답들이 있다. 예를 들어, 러시아워인 오후 4시~6시를 제외한 시간에 합법적으로 주차할 수 있는 주차 구역이 존재할 수 있다.

각 날짜마다 테이블에 1개 슬롯을 추가하는 것으로 충분하다고 생각할지 모르겠다. 그러나 오전 7시~9시, 오후 4시~6시 예외들이 여럿 존재하는 경우도 있다는 점을 명심해야 한다. 여기에 주말에는 다른 규칙이 적용되는 때도 있다. 예를 들어, 미국 워싱턴 DC에서는 일요일에는 무료로 주차를 할 수 있지만, 토요일은 아니다. 연방 공휴일, 지역 별로 규정된 휴일에 차이가 있을 수 있다.

시간에만 해당하는 이야기가 아니다. 이런 예외 사항은 계속된다. 데이터베이스는 제 아무리 간단한 질문이라도 절대적인 최종 답을 저장해 현실을 모델링할 수 없다. 이는 불가능한 일이다.

Null은 수용 가능하다
때론 필자가 쓴 자바 코드 절반에서 포인터가 널(Null)인지 확인한다고 생각한다. 피곤한 경우 라이브러리 주변에 경계선을 그려 엔트리 메소드(Entry Method)에서만 Null을 테스트한다. API가 나머지 코드에 개방되어 있는 지점들이다. 이렇게 하면 조금 단순해진다. 그러나 결국에는 라이브러리에 손을 뻗어 거기에 있는 작은 메소드를 사용하고 싶어진다. 어이쿠. 이제 이것도 Null인지 아닌지 테스트해야 하고, 처음 정했던 경계는 무너졌다. 또 장벽을 세우는 것 Nullity를 테스트해야 한다. 경계선이 돌파됐다. 장벽을 건축하는 것과 유사하다.

현대적인 언어 설계에서 이 문제를 처리할 방법을 찾는 것은 큰 문제이다. 일부 언어는 '?'로 Null 여부를 확인하는 영리한 방법으로 약간 도움을 주지만, 문제가 사라지지는 않는다. Null은 객체 지향형 프로그래밍을 훨씬 더 복잡하면서도 장황하게 만든다.

사람의 관계를 코드화할 수 있다
동성 결혼이 합법화되었을 때, 유능한 데이터베이스 관리자 한 명은 이것이 Y2K보다 더 큰 문제라는 것을 깨달았다. Y2K는 프로그래머들에게 연도에 새로운 숫자 2개를 추가하도록 하면서 나라 전체를 마비시켰다. 이 데이터베이스 관리자(DBA)는 문제를 해결하기 위해 이전보다 더 정교한 14개의 데이터베이스 스키마로 이 과제를 처리할 방법을 고민했다. 그러나 결국에는 동성 결혼을 금지하는 것이 가장 간단한 해결책이라는 결론을 내렸다.

누가 누구와 결혼하는지 추적하는 것은 시작에 불과하다. 교육기관을 위해 방과 후 아이들을 데려올 수 있는 성인, 아스피린을 줄지 말지 결정할 수 있는 성인을 판단하는 데이터베이스 테이블을 구축한다고 가정하자. 친부모는 쉽다. 그러나 계부, 계모는? 방학이라 집에 잠깐 들른 이복 손위 형제자매는 어떨까? 지난 여름 부모의 결혼식에서 이복 동생을 만난 것을 겨우 기억하는 손위 형제자매이다.

페이스북을 꺼내 '복잡하다!'고 불평하고 싶을 것이다. 그러나 그렇게 불평만 할 수 있는 문제가 아니다. 코드가 정확하지 않을 경우 소송을 초래할 수 있는 법적 문제이다. 법을 정확히 준수해야 한다는 의미이다. 국회가 얼마나 정확히 법을 제정할 수 있는지 의문이 들 것이다. 그러나 워싱턴을 비난하는 것은 잊어라! 아이에게 아스피린을 줘야 한다. 이때 데이터베이스는 뭐라고 말할까?

'유니코드'는 만국 공통의 커뮤니케이션이다
사람의 커뮤니케이션을 규정하는 그림 목록에 포함시킬 이모티콘을 결정하기 위해 자주 회의를 가지는 성실한 위원회가 있다. 이 위원회는 일부 이모티콘을 과감하게 버리는 결정을 내려 누군가의 감정을 상하게 만들기도 한다.

이모티콘이라는 비유전적 문화 요소가 폭증하고 있는 것은 이를 만드는 프로세스가 얼마나 무익한지 알려준다. 갑자기 세상이 이모티콘에 제약이 너무 많다는 점을 알게 되어, 문자와 문화를 상징하는 사진을 섞는 방법을 쓴다면, 이들 이모티콘 가운데 쓸만한 것이 있을까?



2017.03.31

프로그래머들이 스스로에게 하는 9가지 거짓말

Peter Wayner | InfoWorld

프로그래머들은 자부심을 갖고 있다. 나쁘게 말하면 교만하다. 그도 그럴 것이 다른 사람들에게는 데이터베이스에 손을 뻗어 현실을 바꿀 힘이 없다. 세상이 작동하는 방식을 정립하기 위해 컴퓨터에 더 많이 의지할수록 프로그래머의 영향력도 커진다.

그러나 '교만'은 '나락'의 선봉이다. 우리 모두가 공유하는 힘은 진짜이다. 그러나 절대적인 힘은 아니며, 때론 공허하다. 사실 항상 공허하다. 완벽한 코드란 존재하지 않기 때문이다. 때론 행운을 빌고, 한계를 정한다. 컴퓨터는 실수를 하기 때문이다. 컴퓨터에 지나칠 정도로 많은 오류가 발생할 수 있다. 우리 모두 직접 경험해 잘 알고 있는 사실이다.

물론 프로그래머들의 잘못된 가정이 초래한 문제는 정말 많다. 프로그래머의 가정은 보통 한 때는 진실이지만, 언제까지나 진실인 것은 아니다. 마크 트웨인은 "뭔가를 몰라서가 아니라, 뭔가를 확실히 안다고 착각해 곤경에 빠진다."고 말했다.

케빈 델디케(Kevin Deldycke)가 기트허브(GitHub)에 올린 '프로그래머들이 철석 같이 믿는 착각' 목록은 사이버공간과 현실이 얼마나 동떨어져 있는지 보여준다. 이는 다른 사람들이 계속 추가하면서 항목이 계속 늘어날 그런 목록이다. 'Remember, Caesar, thou art mortal(황제여, 당신도 필멸의 존재라는 점을 명심하라!)'에 해당하는 수 많은 사례를 멋지게 정리한 목록이다.

필자가 가장 좋아하는 항목은 전화번호에 대한 착각이다. 특정 전화번호를 저장하는 것이 7자리 또는 10자리의 번호를 데이터베이스에 입력하는 간단한 일이라고 생각할지 모르겠다. 그러나 이는 착각이다. 국가 코드, 사용하지 않는 번호 등 전화번호를 계속 기록하는 것을 어렵게 만드는 요소가 10여 개에 달한다. 작은 검은색 책자에 전화번호를 적어놓는 러다이트(Luddite)는 얼굴에 만족스러운 미소를 짓고 있을 것이다.

프로그래머들이 사실이라고 확신하는 착각들을 정리해봤다.

질문들의 답은 하나이다.
데이터베이스 테이블은 컬럼으로 가득하고, 각 컬럼에는 정보가 입력되어 있거나 입력되어 있지 않다. 또 가득 차 있거나 비어 있다. 모든 질문에 대한 하나의 답을 찾기가 어려운 이유는 무엇일까?

때론 답이 하나 이상이기 때문이다. 이 경우, 테이블이 문제를 일으키기 시작한다. 한 사람이 별장 전화번호 등 하나 이상의 전화번호를 가지고 있을 수 있다. 데이터베이스 설계자는 여러 답을 저장할 수 있는 다대일, 일대다 매핑으로 이에 대한 해결책을 찾았다. 최신 NoSQL 솔루션은 여러 태그를 첨부한 가능성이 있는 답들을 하나로 통합하는 도큐먼트 모델을 이용한다.

훨씬 더 나은 솔루션이지만, 이 또한 한계를 갖고 있다. 짧은 시간 동안에만 유효한 답들이 있다. 예를 들어, 러시아워인 오후 4시~6시를 제외한 시간에 합법적으로 주차할 수 있는 주차 구역이 존재할 수 있다.

각 날짜마다 테이블에 1개 슬롯을 추가하는 것으로 충분하다고 생각할지 모르겠다. 그러나 오전 7시~9시, 오후 4시~6시 예외들이 여럿 존재하는 경우도 있다는 점을 명심해야 한다. 여기에 주말에는 다른 규칙이 적용되는 때도 있다. 예를 들어, 미국 워싱턴 DC에서는 일요일에는 무료로 주차를 할 수 있지만, 토요일은 아니다. 연방 공휴일, 지역 별로 규정된 휴일에 차이가 있을 수 있다.

시간에만 해당하는 이야기가 아니다. 이런 예외 사항은 계속된다. 데이터베이스는 제 아무리 간단한 질문이라도 절대적인 최종 답을 저장해 현실을 모델링할 수 없다. 이는 불가능한 일이다.

Null은 수용 가능하다
때론 필자가 쓴 자바 코드 절반에서 포인터가 널(Null)인지 확인한다고 생각한다. 피곤한 경우 라이브러리 주변에 경계선을 그려 엔트리 메소드(Entry Method)에서만 Null을 테스트한다. API가 나머지 코드에 개방되어 있는 지점들이다. 이렇게 하면 조금 단순해진다. 그러나 결국에는 라이브러리에 손을 뻗어 거기에 있는 작은 메소드를 사용하고 싶어진다. 어이쿠. 이제 이것도 Null인지 아닌지 테스트해야 하고, 처음 정했던 경계는 무너졌다. 또 장벽을 세우는 것 Nullity를 테스트해야 한다. 경계선이 돌파됐다. 장벽을 건축하는 것과 유사하다.

현대적인 언어 설계에서 이 문제를 처리할 방법을 찾는 것은 큰 문제이다. 일부 언어는 '?'로 Null 여부를 확인하는 영리한 방법으로 약간 도움을 주지만, 문제가 사라지지는 않는다. Null은 객체 지향형 프로그래밍을 훨씬 더 복잡하면서도 장황하게 만든다.

사람의 관계를 코드화할 수 있다
동성 결혼이 합법화되었을 때, 유능한 데이터베이스 관리자 한 명은 이것이 Y2K보다 더 큰 문제라는 것을 깨달았다. Y2K는 프로그래머들에게 연도에 새로운 숫자 2개를 추가하도록 하면서 나라 전체를 마비시켰다. 이 데이터베이스 관리자(DBA)는 문제를 해결하기 위해 이전보다 더 정교한 14개의 데이터베이스 스키마로 이 과제를 처리할 방법을 고민했다. 그러나 결국에는 동성 결혼을 금지하는 것이 가장 간단한 해결책이라는 결론을 내렸다.

누가 누구와 결혼하는지 추적하는 것은 시작에 불과하다. 교육기관을 위해 방과 후 아이들을 데려올 수 있는 성인, 아스피린을 줄지 말지 결정할 수 있는 성인을 판단하는 데이터베이스 테이블을 구축한다고 가정하자. 친부모는 쉽다. 그러나 계부, 계모는? 방학이라 집에 잠깐 들른 이복 손위 형제자매는 어떨까? 지난 여름 부모의 결혼식에서 이복 동생을 만난 것을 겨우 기억하는 손위 형제자매이다.

페이스북을 꺼내 '복잡하다!'고 불평하고 싶을 것이다. 그러나 그렇게 불평만 할 수 있는 문제가 아니다. 코드가 정확하지 않을 경우 소송을 초래할 수 있는 법적 문제이다. 법을 정확히 준수해야 한다는 의미이다. 국회가 얼마나 정확히 법을 제정할 수 있는지 의문이 들 것이다. 그러나 워싱턴을 비난하는 것은 잊어라! 아이에게 아스피린을 줘야 한다. 이때 데이터베이스는 뭐라고 말할까?

'유니코드'는 만국 공통의 커뮤니케이션이다
사람의 커뮤니케이션을 규정하는 그림 목록에 포함시킬 이모티콘을 결정하기 위해 자주 회의를 가지는 성실한 위원회가 있다. 이 위원회는 일부 이모티콘을 과감하게 버리는 결정을 내려 누군가의 감정을 상하게 만들기도 한다.

이모티콘이라는 비유전적 문화 요소가 폭증하고 있는 것은 이를 만드는 프로세스가 얼마나 무익한지 알려준다. 갑자기 세상이 이모티콘에 제약이 너무 많다는 점을 알게 되어, 문자와 문화를 상징하는 사진을 섞는 방법을 쓴다면, 이들 이모티콘 가운데 쓸만한 것이 있을까?



X