[스터디 노트4]  임팩트 조직을 위한 데이터 프로젝트 설계와 실행 전략

데이터트러스트
발행일 2024-09-24 조회수 95
데이터트러스트

[스터디 노트4]  임팩트 조직을 위한 데이터 프로젝트 설계와 실행 전략-DataKind의 사례 

빠띠는 ‘데이터로 사회문제를 해결하는 시민의 데이터 플랫폼’을 구축하기 위해 다양한 공익데이터 활동을 진행하고 있습니다. 이는 여러 파트너와 이해관계자와 협력하여 만들어가야 하는 중요한 작업입니다. 그렇기에 공익을 위한 데이터 활동이 무엇인지, 그리고 새로운 인공지능 서비스가 끊임없이 등장하는 시대에 왜 사회문제와 관련된 데이터를 논의해야 하는지에 대한 심도 있는 논의가 필요합니다.

이러한 취지에서 빠띠는 ‘인공지능 시대, 데이터 액티비즘과 거버넌스'라는 주제로 스터디를 진행하고 있습니다. 이 스터디는 기술과 사회혁신 두 분야에서 연구 및 국제협력 경력을 보유한 김정원 박사의 발제로 총 4회에 걸쳐 진행되며, 데이터와 시민의 역량, 데이터 액티비즘의 개념, 그리고 데이터의 생산, 관리, 공유를 둘러싼 거버넌스 유형 등 국내외 인공지능과 데이터 관련 주요 이슈를 다룹니다.

스터디를 통해 얻은 핵심 내용을 요약하여 더 많은 분들과 나눔으로써 공익데이터 활동에 대한 이해를 넓히고, 사회문제 해결을 위한 데이터 활용의 중요성을 공유하고자 합니다.  

 

네 줄 요약 

  • DataKind의 활동은 데이터 과학과 인공지능이 기술 도구를 넘어 사회적 문제 해결의 강력한 수단이 될 수 있음을 보여준다. 
  • 다양한 이해관계자와의 파트너십 협력이 데이터의 실질적인 활용과 변화를 이끄는 핵심 요소이다.
  • 데이터 활용 과정에서 윤리적 고려, 특히 다양성, 형평성, 포용성(DEI)을 포함하는 것이 데이터 프로젝트의 성공과 사회적 신뢰를 유지하는 데 필수적이다. 
  • 데이터 프로젝트가 임팩트를 창출하려면 조직의 데이터 성숙도가 필요하며, 특히, 리더십이 데이터에 대한 이해를 갖출 때, 장기적인 임팩트를 만들어낼 가능성이 높아진다.

 

  1. 데이터카인드(DataKind)라는 단체는? https://www.datakind.org/
  • 2012년 미국에서 설립된 비영리 단체로 데이터 전문가와 자원봉사자를 비영리 단체와 연결하여 데이터 활동 기반의 사회적 문제 해결을 목표로 하는 조직 
  • 샌프란시스코, 뉴욕, 런던 등 7개 도시에  사무소를 운영하며, 전 세계적으로 약 3만 명 이상의 자원봉사자와 함께 활동하고 있음.  

  • 데이터카인드가 진행하는 프로젝트 유형
    • 데이터다이브(DataDive): 주말 동안 집중 진행되는 단기 프로젝트로, 데이터 과학자, 개발자, 디자이너 등 다양한 참여자가 모여 특정 이슈에 대한 솔루션을 개발  
    • 데이터코프(DataCorps): 장기적이고 심층적인 프로젝트로, 전문가 그룹이 수개월에 걸쳐 사회 문제를 해결하기 위한 데이터 솔루션을 개발
    • 데이터인어데이(Data in a Day): 하루 동안 진행되는 집중 워크숍으로 비영리 단체가 데이터를 활용하는 방법을 배우고 실습
    • 교육 프로그램: 비영리 단체를 위한 데이터 리터러시, 인공지능, 머신러닝에 관한 교육을 제공 

  • 데이터카인드의 대표적인 프로젝트
    • 의료 접근성 개선: 라이더스포헬스(Riders for Health)와 협업하여 의료 샘플을 운송하는 시간을 기존 60일에서 하루로 단축하여 지역의 의료 서비스 제공 속도를 개선함. 
    • 인종간 경제적 격차 해소: 블랙웰스데이터센터(Black Wealth Data Center)와 함께 인종 간 경제적 격차를 분석하는 데이터베이스를 구축하고, 이를 시각화하여 정책 개선을 이루어냄.   
    • 화재 사망률 감소: 홈파이어리스크맵(Home Fire Risk Map)을 개발하여 화재 위험이 높은 지역을 식별하고, 90만 건의 가정 안전 점검을 사전에 실시함. 

  • 데이터카인드의 데이터 활동에서 주목할 점! 
    • 다양한 자원봉사자 활용: 특정 부분에 국한되지 않고 실제 프로젝트 진행에 중요한 역할로 자원봉사자를 참여시킴. 직원은 조직 운영과 홍보를 담당하는데 집중하는 방식으로 조직역량을 관리함. 
    • 데이터 프로젝트의 진행 노하우: 역할 분담과 자원봉사자 참여 방식에 관한 가이드라인을 개발하여 보유함.  
    • 다양성, 형평성, 포용성(Diversity, Equity, Inclusion, DEI): 데이터 프로젝트의 윤리적 고려 사항으로 다양성, 형평성, 포용성 요소를 고려 및 적용하고 있음.  

 

  1. 데이터카인드의 체계적인 프로젝트 프로세스 
  • 체계적인 프로세스를 통해 효과성을 높이고, 과정 및 데이터의 윤리적 고려사항을 충분히 반영하여 지속가능한 임팩트를 창출하고자 함.
  • 이 프로세스는 ‘발굴, 디자인, 준비, 실행, 공유, 평가’의 6단계로 진행됨. 


단계1: 발굴) 문제 정의와 데이터 성숙도 평가를 통해 사회적 문제 해결 가능성 탐색 

    • 데이터를 통한 사회적 문제 해결 가능성 탐색: 파트너 단체와 협력할 데이터 프로젝트 기회를 모색하고, 단체가 제공하고자 하는 데이터가 분석을 통해 어떤 공익적 가치, 사회적 임팩트를 창출할 수 있을지 판단(왜 데이터 프로젝트가 필요한가에 대한 질문)
      • 임팩트 지도(Impact Map) 활용
        • 임팩트지도란? 데이터 프로젝트에 적합한 문제를 발견하기 위한 도구로, 조직의 미션과 프로세스를 효과적으로 일치시키기 위한 단계적인 사고 과정을 지원함. 
        • 목표설정(목표로 삼고 있는 사회적 문제나 변화를 정의하는 단계)→행동 변화 유도(임팩트를 만들어내기 위해서는 어떤 행동의 변화가 필요한가?) → 근거 분석(행동 변화를 유도하기 위해 데이터가 어떤 방식으로 분석되고, 그 분석 결과가 행동 변화의 근거로 활용될 것인가?) → 데이터 분석(근거를 제공하기 위한 필요 데이터 정의) 

임팩트지도의 과정을 개발도상국 마이크로렌딩 프로젝트에 적용해본 예시(출처: Drafting Impact Maps and Project Statements, 김정원 재정리)

 

    • 협업 검토: 프로젝트의 필요성, 잠재적 영향력, 실현 가능성, 윤리성 등을 종합적으로 고려
      • 협업 단체의 데이터 활용/성숙도를 평가
        • 데이터 성숙도 평가 지표 활용: 데이터 오차드(Data Orchard)에서 비영리 조직의 데이터 성숙도를 측정하기 위한 지표 및 체크리스트 개발
        • ‘활용, 데이터, 분석, 리더십, 문화, 도구, 역량’이라는 7가지 주요 주제에 따라 세부 질문 항목에 대해 정도를 ‘광범위하게 / 중간 정도로 / 약간 / 전혀 / 모름 / 해당 사항 없음’의 척도로 측정 

(출처: 데이터 오차드의 데이터 성숙도 프레임워크를 참고하여 김정원 정리)

    • 프로젝트에 참여할 주요 이해관계자 파악
    • 기존에 나온 명백한 대안이나 활용가능한 솔루션이 없는지 검토 
    • 프로젝트의 윤리성 평가를 위한 질문 
      • 이 프로젝트가 누구에게 이익이 되는가? 
      • 과정과 솔루션에서 잠재적으로 발생할 수 있는 부작용은 없는가? 
      • 데이터의 출처와 품질은 신뢰할 수 있는가? 
      • 개인정보 보호 문제는 없는가? 

데이터 프로젝트를 수행하고자 하는 조직이 고려해야 할 사항 

  • 데이터카인드의 활동을 통해 데이터 프로젝트를 성공적으로 수행하려는 조직이 갖춰야 할 요소를 확인할 수 있음.
  • 특히 리더십이 중요한 역할을 하며, 다음과 같은 요소가 필요함. 
    • 데이터에 투자: 조직 의사결정자들은 단순히 그들의 의제를 증명하기 위해서가 아니라, 의사결정을 내리는 데 데이터를 사용하는 것에 동의해야 함.
    • 자원봉사의 가치 존중: 다양한 참여자(데이터 과학자, 자원봉사자)들의 작업을 신뢰하고, 자원봉사자와 함께 일할 때 요구되는 유연성을 이해해야 함.
    • 프로젝트 구현을 위한 지원 의지: 리더십 전략과 자원 할당이 프로젝트의 목표와 일치해야 함. 
    • 혁신을 추구하는 관점: 좋은 결정을 내리고 기술 도구가 실제 활용될 수 있도록 하기 위해 정보에 기반한 관점을 갖고 있어야 함.  
    • 다양성, 공정성, 포용성에 관한 가치 일치: 프로젝트 과정과 결과물에서 DEI의 가치를 공유하고 실천해야 함.  


단계2: 디자인)프로젝트의 목표 및 방향성 설정 

단계3: 준비) 팀 구성 및 필요한 기술적 인프라 구축  

    • 팀 구성: 전문가, 자원봉사자를 모집하여 팀 구성. 데이터 과학자, 개발자, 디자이너, 해당 사회이슈 전문가 등 다양한 배경을 가진 사람들이 참여하도록 하는 것이 핵심 
    • 역할 분담 및 소통: 프로젝트 킥오프 미팅을 통해 팀의 역할을 분담하고 원활한 소통을 위한 커뮤니케이션 채널 개설

단계4: 실행) 프로토타입을 개발하고 피드백을 받아 최종 모델을 완성  

    • 최소기능제품(Minimum Viable Product, MVP)를 개발 
    • 데이터 분석 및 모델링, 프로토타입 설계 및 개발, 피드백 수집 및 반영
    • 지속적 피드백 반영: 지속적인 피드백 과정을 거치며 프로토타입을 개선. 이 과정에서 윤리적 고려사항을 점검하여 예기치 못한 부작용을 방지함. 
    • 최종 모델 완성 및 전달
      • 프로토타입을 기반으로 최종 모델 완성
      • 프로젝트 성과 및 과정을 문서화하여, 파트너 단체에 지식을 이전함. 이는 프로젝트의 지속가능성을 높이는 데도 기여함. 

단계5: 평가 및 공유) 결과물을 파트너와 공유하고, 성과를 평가하여 개선점 도출  

    • 성과 평가: 프로젝트 종료 후 창출된 임팩트를 모니터링하고 평가(3~24개월)
    • 개선점 도출: 프로젝트 임팩트를 평가하고, 학습 내용을 정리하여 향후 개선 방안을 도출. 이 내용은 추후 데이터카인드 활동에도 반영함. 

 

  1. 데이터카인드를 통해 살펴본 공익 데이터 프로젝트 실행의 포인트 

[포인트1] 데이터 활동을 왜 해야 할까? 데이터 활동의 필요성 이해하기 

    • 파트너 조직이 직면한 문제를 명확히 이해
    • 조직이 보유한 데이터를 파악하고, 이를 통해 문제 해결의 가능성을 객관적으로 탐색  
    • 문제 해결을 위한 아이디어를 발굴하고 프로젝트를 계획하는 솔루션 브레인스토밍 실행 

[포인트2] 데이터 활용의 윤리적 측면을 단계마다 점검하기 

    • 데이터카인드 활동에서 가장 중요한 검토 요소는 데이터 윤리 관련 요소임. 
    • 아래와 같은 질문을 통해 윤리적 사항을 검토 
      • 프로젝트에 활용되는 데이터의 사용이 공정한가? 
      • 개인정보가 적절히 보호되고 있는가? 
      • 알고리즘의 의사결정 과정이 투명한가? 
      • 데이터 자체에 잠재적인 편향성이 있는가?
      • 프로젝트의 솔루션이 의도치 않은 부작용을 초래할 가능성이 있는가? 

[포인트3] 데이터 프로젝트 성공을 위한 핵심 요소 

    • 문제 해결보다 ‘문제 발견'이 더 어려울 수 있으며 문제 정의를 위한 ‘변화 이론'과 ‘임팩트 지도'를 활용하는 등 도구를 활용해 객관적 검증 실행 
    • 데이터카인드와 협력할 때, 파트너 조직의 리더십이 자원봉사의 힘과 ‘다양성, 공정성, 포용성'의 가치를 이해하는 것이 프로젝트 성공과 연결
    • 기술 솔루션 개발 시 인간 중심의 디자인과 최종 사용자 중심의 접근이 필수적이며, 당사자의 목소리를 반영해야 함. 
    • ‘누가' 결과물을 사용할 것인지 고려하여 그에 맞는 해결책을 제시(예: 웹페이지, 대시보드, 앱과 같은 다양한 형태 고려)
    • 이해관계자와의 소통을 통해 프로젝트의 성공을 어떻게 측정할 것인지에 대한 기준을 설정 

 

함께 생각해봐요.

  • 모든 비영리 단체가 데이터 활용에 필요한 인프라나 자원을 갖추고 있지 않습니다. 이러한 데이터 접근성의 불평등을 개선하기 위해 무엇이 필요할까요? 
  • 데이터는 편향되거나 윤리적인 문제를 일으킬 가능성이 항상 존재합니다. 프로젝트에서 예기치 못한 편향이나 윤리적 이슈를 예방하기 위해 무엇을 고려하고 준비해야 할까요? 
  • 공익을 위한 데이터 프로젝트가 더 활성화되려면, 어떤 지원과 기반이 필요할까요? 

 

* 정리: 박아영 빠띠 협력가(ahyoung@parti.coop
* 본 내용은 김정원 박사가 진행한 ‘인공지능 시대, 데이터 액티비즘과 거버넌스' 스터디 내용을 바탕으로 작성되었습니다. 

Comment (0)