합성데이터
“생성형 AI가 데이터 문제의 해법” 주요 사용례와 고려사항
생성형 AI는 격차 메우기, 문서에서 정보 추출, 데이터 품질 개선 등 수많은 데이터 문제를 해결할 수 있지만, 전문가들은 신중을 기하고 기존 접근 방식과 함께 사용해야 한다고 말한다. 현재 저소득 국가에서는 1억 4,300만 명의 환자가 수술을 기...
“없으면 만들어 쓴다” AI 학습용 데이터 기술·시장 현황 - Tech Report
뛰어난 인공지능(AI)을 만들려면 뛰어난 데이터가 뒷받침되어야 한다. 사람도 어떤 지식을 쌓기 위해 책과 참고서를 살펴보듯이, AI도 그 성능을 높이려면 학습용 데이터가 필요한 것이다. 그런 의미에서 AI를 위한 참고서, 즉 AI가 이해하는 방식과 수...
MIT 출신 스타트업 데이터세보, 합성 데이터 품질 검증하는 오픈소스 공개
MIT 컴퓨터과학 및 인공지능 연구소 출신 연구원이 만든 스타트업 데이터세보(DataCebo)가 합성데이터(synthetic data) 품질을 실제 데이터와 비교 분석해주는 SD메트릭스(Synthetic Data Metrics, SD Metrics)를...
지속 테스트와 머신러닝에 합성 데이터를 적극 활용하는 방법
데브옵스 팀의 목적은 배치 회수를 늘리고 프로덕션 단계에서 발견되는 결함 개수를 줄이는 동시에 마이크로서비스와 고객 대면 애플리케이션에서부터 직원 워크플로우와 비즈니스 프로세스 자동화에 이르는 모든 것의 안정성/신뢰성을 높이는 것이다. CI/CD(지...
데이터베이스 보안을 향상시키는 11가지 기술
데이터베이스에는 매우 민감한 내용을 포함한 방대한 양의 개인정보가 저장되므로 책임이 있는 기업이라면 관리에 신경쓸 수밖에 없다. 이제 데이터베이스 개발자는 정교한 도구와 기술을 사용해 정보를 안전하게 지키면서 원하는 작업을 할 수 있다. 비유하자면 살...
데이터베이스
암호화
Basic encryption
데이터 준비에서 하드웨어 선택까지··· '머신러닝 트레이닝' 안내서
머신러닝(ML)을 제대로 활용하기 위한 기본 전제는 모델을 적절히 훈련시키는 것이다. 데이터로부터 신뢰할 만한 결과를 도출해내는데 참고할 만한 12가지 조언을 정리했다. 머신러닝은 오늘날 가장 실용적인 AI 응용 기술이라고 ...