주요 콘텐츠로 건너뛰기

데이터 전문가

By Eric Wallace

새끼들과 함께 연못에 있는 암컷 청둥오리

암컷 청둥오리와 새끼 청둥오리(롭 비엘로스키 CO)

버지니아의 eBird 데이터베이스의 정확성을 보장하기 위해 eBird 전담 검토팀이 막후에서 작업하고 있습니다.  스프레드시트 마법사 Rob Bielawski는 데이터 필터링 프로세스를 혁신하는 데 도움을 주고 있습니다.

주 전체 검토자 세 명에 7명의 지역 전문가 그룹이 추가되었습니다. 자원 봉사자들은 아틀라스의 품질 관리의 첫 번째 라인 역할을 합니다.

"데이터베이스의 무결성을 유지하고 과학 및 보존 커뮤니티에서 이를 활용하려면 데이터 품질이 높아야 합니다."라고 VABBA(2 ) 디렉터인 애슐리 필(Ashley Peele) 박사는 말합니다. "이 헌신적인 분들의 도움이 없었다면 불가능했을 것입니다."

오늘날의 프로세스는 몇 년 전( 30 )과는 매우 다릅니다. "그 당시에는 모든 것이 수작업으로 이루어졌습니다."라고 지역 eBird 리뷰어 마이크 스틴슨은 말합니다. 초기 번식 조류 지도 제작의 베테랑인 스틴슨은 1985 에서 첫 번째 VABBA에 자원했습니다. 수기로 작성된 기록에서 이상 징후를 찾아내는 작업은 불안정하고 시간이 많이 걸리는 작업이었지만, eBird의 온라인 데이터베이스와 디지털 필터링 기술을 통합한 결과 효율성이 크게 향상되었습니다.

하지만 동시에 응모작도 증가하고 있습니다. 400 의 버더 참가자 수에 비해 950 보다 더 많은 수의 사람들이2 에 기여했습니다. 아틀라스의 두 번째 시즌( 2017)이 끝날 무렵에는 이미 500,000 기록을 넘어서는 성과를 거뒀습니다.

"데이터의 양이 엄청나게 많고 매일 증가하고 있습니다."라고 Peele은 말합니다. "모든 기록을 수작업으로 검토하려면 11명이 훨씬 더 많은 인력이 필요할 것입니다."

바로 이 부분에서 eBird의 데이터 필터가 유용합니다. 자동화된 팩트 체커 팀과 마찬가지로, 이들은 주정부 검토자들이 잠재적으로 문제가 될 수 있는 항목을 찾아내는 데 도움을 줍니다.

둥지에 있는 청회색 모기잡이

둥지에 있는 청회색 모기잡이(롭 비엘로스키 CO)

"eBird에 체크리스트를 제출하면 각 기록(예: 종 항목)이 데이터 필터와 비교되어 특정 예상 기준에 해당하는지 확인합니다."라고 Rob Bielawski는 말합니다. 주 전역의 검토자인 Bielawski는 2015 이후 연방에서 eBird 데이터 필터를 유지 관리하고 개선하기 위해 노력해 왔습니다. "항목이 이러한 기준을 벗어나는 경우 검토 대상으로 플래그가 지정되고 현지 검토자가 자세히 검토할 수 있도록 검토 대기열로 보내집니다."

일반적인 깃발은 새가 있을 것 같지 않은 장소, 너무 높은 농도 또는 있어서는 안 되는 시간대에 새가 목격되는 경우입니다.

예를 들어, "12월에 블랙스버그 근처에서 검은목지빠귀를 본다면 놀랄 일이지만( 2017!), 5월 초순에서 중순에 검은목지빠귀가 여러 마리가 나타난다고 해도 눈 하나 깜짝하지 않을 것입니다." 비엘로스키의 설명입니다. 마찬가지로, " 1,000 큰기러기 무리를 관찰하는 것은 3월 한 달 동안에는 해안 조류에게 특이한 일이 아니지만, 8월에 한 마리라도 관찰하는 것은 확실히 주목할 만한 일입니다."

eBird는 모든 수준의 조류 관찰자에게 개방되어 있기 때문에 유사한 종을 오인할 수 있는 가능성도 자주 보고됩니다. 색과 신체적 특징의 미묘한 차이로 인해 선의의 초보 조류 관찰자들은 종종 한 종을 다른 종으로 착각하기도 합니다.

비엘로프스키는 "조류 관찰 세계에서는 항상 이상한 일이 일어나고, 그것이 재미의 절반"이라고 말하면서도, eBird 필터의 핵심은 "이상 보고를 포착하여 현지 전문가가 조사할 수 있도록 하는 것"이라고 강조합니다. 후속 검토 프로세스를 통해 eBird 데이터베이스의 무결성을 유지합니다.

항목이 플래그가 지정되면 어떻게 되나요?

비엘로프스키는 "항상 그 사람이 '예' 또는 '아니오'라고 명확하게 대답할 수 있는 사진을 가지고 있기를 바랍니다."라고 말합니다. 그렇지 않은 경우, 조류 관찰자의 메모를 샅샅이 뒤져 이상 징후와 단서를 찾아 그 사람이 본 것을 이해하는 데 도움이 되는 정보를 찾습니다. 때로는 오타처럼 단순한 실수일 수도 있습니다. "지금 버지니아 비치에서 물총새 10마리를 봤다고 신고한 항목을 검토하고 있다면, 의도적으로 '1'를 '10'으로 입력한 실수로 잘못 입력한 것일 수 있다고 의심할 수 있습니다."

결정이 간단하지 않은 경우, 비엘로프스키가 목격에 대한 질문이 담긴 이메일을 보내드립니다. 그는 대부분의 조류 관찰자들이 리뷰의 중요성을 이해하고 기꺼이 도움을 준다고 말합니다.

롭 비엘로스키, VA의 eBird 필터 전문가

롭 비엘로스키, VA의 eBird 필터 전문가

비엘로프스키는 "목표는 실제로 존재하는 상황을 보다 사실적으로 묘사하기 위해 함께 노력하는 것입니다."라고 말합니다. '고귀한 대의'에 헌신하는 그는 엔지니어로서 풀타임으로 일하는 것 외에도 데이터 필터 유지 관리, eBird 기록 검토, Atlas 소셜 미디어 매체 관리, 버지니아 조류학회 웹사이트 (프로젝트의 주요 후원자 중 하나) 유지 관리 등 eBird 및 VABBA2 관련 작업에 일주일에 20 시간 이상을 자원봉사로 쓰고 있습니다. 무엇보다도 그는 여전히 시간을 내어 현장에 나가서 지도를 작성합니다. "제가 이 일을 하는 가장 큰 이유 중 하나는 전체 이야기를 알지 못하면 한 종을 도울 수 없기 때문입니다." 개체 수가 감소하는 새들을 돕기 위해 환경 보호론자들은 "새들이 어디에 있는지, 어디에 없는지 알아야 한다"고 말합니다.

무엇보다도 조류 지형을 정확하게 파악하려면 정확한 기록이 있어야 합니다.

 


수학적 사고와 스프레드시트 조작에 능숙한 토목 엔지니어인 그는 단순한 유지보수 이상의 야심찬 개선 목표를 가지고 있습니다.

"제가 2015 에 입사했을 당시에는 20 지역 데이터 필터가 있었습니다."라고 그는 말합니다. 34은 "소규모 지역과 독립적인 도시 및 카운티를 위한 맞춤형 필터를 포함하도록 시스템을 확장할 계획"이라고 밝혔습니다. 이렇게 하면 기록이 "검토를 위해 더 정확하게 플래그가 지정"되고 eBird 사용자와 검토자 모두의 비효율을 최소화할 수 있습니다.

향후 고도별 필터링 기능 등이 개선될 수 있습니다. 이렇게 하면 블루릿지 산맥처럼 높은 고지대에서 번식하는 새가 많지만 인근 계곡에서는 번식하지 않는 지역에서 오조류를 크게 줄일 수 있습니다. 예를 들어, "다크아이드준코는 스카이라인 드라이브에서 번식하지만, 여름철에는 필터 영역의 약 99 퍼센트에서 드물게 관찰됩니다."라고 비엘로프스키는 말합니다. 따라서 조류 관찰자가 정확한 목격 정보를 입력하면 eBird에 의해 관찰 정보가 플래그가 지정됩니다.  "이와 같은 고도 문제는 관찰자와 검토자 모두에게 불필요한 수고를 가중시키므로 가능한 한 이러한 문제를 최소화하는 것이 목표입니다."

"제 목표는 지속적으로 개선하는 것입니다."라고 비엘로프스키는 말합니다. 그는 필터가 "결코 완벽할 수는 없을 것"이라고 마지못해 인정하지만, 카운티 및 도시 수준의 사용자 지정은 혁명적이라고 할 수 있습니다. 그러나 조류의 경우 인위적인 경계는 대부분 자의적인 것으로 남을 것이라고 그는 말합니다. "특정 서식지를 기반으로 필터를 만들면 좋을 것 같습니다." 그는 이러한 프로젝트의 실행 가능성에 대해 의구심을 품고 있지만(서식지가 너무 파편화되어 있어 그 규모의 마이크로 레벨 개선이 불가능할 수도 있습니다), 그럼에도 불구하고 그는 "우리가 얻을 수 있는 한 최대한 가까이"를 제공할 계획이라고 단언합니다.

필 박사는 또한 언젠가 표준 eBird 검토 시스템에 번식 코드 필터를 구축하기를 희망합니다.  현재로서는 매년 겨울마다 eBird 시스템 외부에서 집중적인 Atlas 데이터 검토가 이루어지고 있습니다.  "Atlas 지역 코디네이터이자 리치몬드 대학교 교수인 루이스 바넷 박사의 도움으로 육종 데이터를 구체적으로 검토하기 위한 코드를 개발했습니다."  이 코드는 잠재적인 번식 코드 오류에 대해 eBird 기록에 플래그를 지정한 다음 비수기에 수작업으로 검토합니다.  이 연간 프로세스에는 수만 개의 레코드가 포함되며 Atlas의 데이터 품질 관리의 두 번째 라인입니다.

~ 에릭 월리스, VABBA2 커뮤니케이션

  • 7월 19, 2018