개발자 / 데이터ㆍ분석

F#을 사용해야 하는 14가지 분명한 이유

Martin Heller | InfoWorld 2018.04.26


F#은 맵리듀스에 유용하다
맵리듀스는 빅데이터에 자주 사용되는 효율적인 2단계 프로세스로, 하둡에서 명시적으로 지원된다. 이 F# 예제에서는 정수 목록을 맵핑하고 줄인다. 먼저 짝수로 목록을 필터링한 다음 각 수에 2를 곱하고, 마지막으로 목록에 있는 모든 요소의 합을 구해 집계하거나 결과를 줄인다. List.map은 강력한 고차 함수다. 고차 함수란 다른 함수를 인수로 받는 함수를 말한다. F#은 목록과 배열 외에 레코드, 시퀀스, 데이터 형식 공급자, 그리고 LINQ(언어 통합 쿼리)를 지원한다.



F#에는 레코드가 있다
F# 레코드는 명명된 값의 단순한 집계를 나타내며, 선택적으로 멤버와 함께 나타낼 수 있다. 아래 예제에서는 먼저 4개의 명명된 값이 있는 Book 레코드 형식을 정의한 다음 동일한 4개의 이름을 사용하여 레코드를 생성한다. F# 컴파일러는 이름을 대조하여 Book 형식을 정확히 추론한다.



F# 레코드는 옵션 값을 가질 수 있다
레코드는 모든 명명된 값을 항상 포함할 필요는 없다. 형식을 정의할 때 명명된 값에 option 특성을 부여하면 레코드에서 제외할 수 있다. 옵션 값을 설정할 경우 이 값은 None(null이 됨)이 될 수도 있고 Some 다음에 설정하고자 하는 값을 붙일 수도 있다. 레코드 필드는 속성으로 자동 노출된다는 면에서 클래스와 구분된다. F#의 클래스와 구조체는 .NET 클래스 및 구조체이며 C# 및 비주얼 베이직 .NET과 호환되므로 따로 예는 들지 않겠다.



F#에는 시퀀스가 있다
F#의 시퀀스는 한 가지 형식의 모든 요소의 논리적 계열이다. 시퀀스는 대규모의 정렬된 데이터 컬렉션이 있지만 모든 요소를 사용할 필요는 없는 경우에 특히 유용하다. 개별 시퀀스 요소는 필요한 경우에만 계산되므로 사용되지 않는 요소가 있는 상황에서는 시퀀스가 목록보다 더 나은 성능을 제공할 수 있다. Seq 모듈은 시퀀스가 포함된 조작을 지원한다. 아래 화면은 간단한 시퀀스, 식이 있는 시퀀스, 그리고 필터가 있는 시퀀스이다.



F#은 데이터 공급자와 LINQ를 지원한다
아래는 TryFSharp 편집기를 사용해서 온라인 프리베이스(Freebase) 기상 데이터 집합을 열고 데이터 공급자에 바람 값이 가장 크기 기록된 사이클론을 쿼리한다. query { } 구문은 F#용 LINQ를 구현한다. 이러한 DLL 사용은 TryFSharp에만 해당된다. 비주얼 스튜디오에서는 Microsoft.FSharp.Data.TypeProviders를 연 다음 적절한 데이터 공급자 서비스를 사용한다.



결과는 다음과 같다.



F#은 하둡 데이터를 분석할 수 있다
다음 예제에서는 TryFsharp 편집기를 사용해서 하둡 하이브(Hive) 인스턴스를 연다. 인스턴스에는 다른 데이터 집합과 함께 붓꽃 특성에 대한 측정값과 측정 단위 주석이 포함되어 있다. 그에 맞춰 HiveTypeProvider 속성에서 단위 주석 사용을 활성화한다.



결과는 다음과 같다.

val avgPetalLength : float<Data.UnitSystems.SI.UnitNames.metre> = 0.0374966443


F#은 패턴 매칭을 한다
F# match 식은 식과 패턴 집합의 비교를 기반으로 하는 분기 제어 기능을 제공한다. 아래 예제에서 라인 1~7은 재귀 isPalindrome 함수를 정의한다. 라인 8~10은 전체 문자열을 처음 사용할 때 호출하는 isPalindrome에 대한 래퍼 함수를 정의한다. "aba"는 회문이므로 라인 9의 then 절은 Some s를 반환하고, 라인 11의 match 문은 " The string aba is palindrome"을 생성한다. 라인 14의 _ pattern은 기본 케이스다.



F#의 match..| 문은 C#, C++ 및 자바의 switch..case 문에 비해 장점이 많은데, 가장 중요한 장점은 버그를 덜 일으킨다는 점이다.

F#은 비동기 워크플로를 지원한다
F#은 .NET 프레임워크의 모든 요소에 액세스할 수 있지만 비동기 워크플로를 위한 자체 구문도 있다. async { expression } 구문은 비차단 연산을 정의한다. do! 키워드는 비동기 연산을 수행하고 결과를 기다린다. let! 키워드는 비동기 연산을 대기하고 결과를 할당한다. use!는 비동기 연산을 기다리고 결과를 할당하고 리소스를 해제한다. Async.RunSynchronously는 비동기 연산을 실행하고 결과를 기다린다.



병렬성을 추가하려면 Async.Parallel 함수를 사용한다. 이 함수는 Async 객체의 목록을 취하고, 병렬로 실행할 각 Async 작업 객체를 위한 코드를 설정하고, 병렬 연산을 반영하는 Async 객체를 반환한다. 그런 다음 그 결과를 Async.RunSynchronously로 전달한다. 예제는 취미와 수익을 위한 F#(F# for Fun and Profit)에서 가져온 것이다.  editor@itworld.co.kr

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.