Απολυμάνσεις Αθήνα

r gather 예제

150 150 trap

unite()를 사용하여 마지막 예제에서 만든 세기와 연도 열에 다시 참여할 수 있습니다. 해당 데이터는 DSR 패키지에 테이블6로 저장됩니다. 아래의 간단한 티브를 깔끔하게 정리하십시오. 당신은 확산하거나 수집해야합니까? 변수는 무엇입니까? 이것은 매우 일반적인 실제 예제 데이터 집합입니다. 여기에는 중복 열, 홀수 변수 코드 및 누락된 값이 많이 포함되어 있습니다. 요컨대, 누가 지저분한, 우리는 그것을 정리하는 여러 단계가 필요합니다. dplyr와 마찬가지로 tidyr는 각 함수가 한 가지 를 잘 수행하도록 설계되었습니다. 즉, 실제 상황에서는 일반적으로 여러 동사를 파이프라인에 함께 문자열로 묶어야 합니다. 이는 spread() 연습에서 만든 테이블과 유사합니다. 이제 이 데이터 프레임을 변경하여 연도가 변수이고 1999년과 2000년이 변수가 아닌 값이 되도록 하려고 합니다.

우리는 수집 기능으로이 작업을 수행 할 것입니다 : 확산은 수집의 반대입니다. 관찰이 여러 행에 분산되어 있을 때 사용합니다. 예를 들어 table2를 수행합니다: 관측값은 1년 동안의 국가이지만 각 관측값은 두 행에 분산되어 있습니다. spread() 및 gather() 에서는 데이터의 레이아웃을 변경하여 열에 변수를 배치하고 관찰을 행에 배치할 수 있습니다. separate() 및 unite() 는 셀을 분할하고 결합하여 각 셀에 하나의 완전한 값을 배치하는 데 도움이 됩니다. 수집은 여러 열을 취하고 키 값 쌍으로 축소되어 필요에 따라 다른 모든 열을 복제합니다. 변수가 아닌 열이 있는 경우 gather()를 사용합니다. 여러 가지 방법으로 테이블 형식 데이터를 구성할 수 있습니다. 예를 들어 아래 데이터 집합은 네 가지 방법으로 구성된 동일한 데이터를 표시합니다.

각 데이터 집합은 국가, 연도, 인구 및 서비스 케이스의 4개 변수의 동일한 값을 표시하지만 각 데이터 집합은 값을 다른 레이아웃으로 구성합니다. DSR 패키지의 데이터 집합에 액세스할 수 있습니다. 가장 좋은 시작 장소는 거의 항상 변수가 아닌 열을 모으는 것입니다. 각 분기가 변수를 나타내도록 시간 변수(분기로 표시)가 구조화되어 있기 때문에 이 데이터는 넓은 것으로 간주됩니다. 시간 구성 요소를 개별 변수로 재구성하려면 각 분기를 한 열 변수 내에서 수집하고 두 번째 열 변수에서 각 분기와 관련된 값을 수집할 수도 있습니다. 기본적으로 separate()는 영숫자가 아닌 문자(예: 숫자 또는 문자가 아닌 문자)가 표시되는 모든 곳에서 값을 분할합니다. 예를 들어 위의 코드에서 separate()는 정방향 슬래시 문자의 속도 값을 분할합니다. 특정 문자를 사용하여 열을 분리하려는 경우 문자를 separate()의 9월 인수에 전달할 수 있습니다.

예를 들어 위의 코드를 다음과 같이 다시 작성할 수 있습니다. 여기에는 중복 열, 홀수 변수 코드 및 누락된 값이 많이 포함되어 있습니다. 요컨대, 누가 지저분하다. 이 예제에서는 table1만 깔끔합니다. 각 열이 변수인 유일한 표현입니다. 데이터는 종종 분석 이외의 일부 사용을 용이하게하기 위해 구성됩니다. 예를 들어, 데이터는 가능한 한 쉽게 입력할 수 있도록 정리되는 경우가 많습니다. 왜 gather() 및 spread()가 완벽하게 대칭되지 않습니까? 예를 들어 마지막 spread() 연습에서 변수 이름이 개별 연도인 데이터 프레임을 만들었습니다.

  • 0