1. 자료 준비
공간자료의 준비란 입수한 공간자료를 지리정보시스템에서 사용할 수 있도록 만드는 작업을 의미한다. 영상자료의 경우 영상 강조 작업 또는 기존 분류체계의 정비 등이 이에 해당하고, 벡터 자료의 경우 선이 교차되는 지점에서 튀어나온 선(overshoot)을 잘라내거나 중복된 선을 삭제하고, 선과 선 사이의 틈을 이어주거나 폴리곤을 생성하는 작업 등이 이에 해당한다. 기존 자료와의 포맷을 일치시키기 위해 벡터와 래스터를 변환하거나 반대로 래스터를 벡터로 변환하는 작업 등이 필요할 수 있다. 또한 부족한 속성자료를 수작업이나 별도의 수치속성자료를 연결함으로써 보완해야 할 수도 있다.
용도에 따라 입수된 자료 중 일부를 삭제하여 필요한 대상만 남기는 작업도 필요할 수 있다. 후속 분석이나 출력작업에 일부 자료가 필요하지 않을 수도 있기 때문이다. 이러한 경우 자료와 지도의 일반화 작업의 수행이 필요하다.
2. 자료 점검 및 보완
입수된 자료는 우선 일관성(consistency)과 완전성(completeness)의 점검이 필요하다. 이 과정에서 기하학적(geometric) 품질 및 위상적(topological) 품질 뿐만이 아닌 의미론적(semantic) 품질도 점검해야 한다.
자료를 정리하기 위한 방법에는 여러 가지 방법이 있다. 시스템에서 오류를 자동적으로 판별한 뒤 잘못된 자료를 수동편집을 통해 수정할 수도 있고, 시스템에서 오류를 판별한 후 자동적으로 수정까지 가능한 경우도 있다. 이러한 정리작업은 표준화된 절차에 따라 수행되는 경우가 대부분이다. 우선 선의 중간을 분리하고, 튀어나온 선을 삭제하고 교차점에 노드를 생성한 후 폴리곤을 생성하는 등의 절차가 그것이다.
폴리곤 자료의 경우 많은 선에 대해 서로 합치는 작업을 우선 수행한다. 해당 작업이 완료되면 선의 개수가 줄어든다. 이 과정에서 각각의 선의 중간점은 늘어날 수 있다. 가끔 폴리곤의 선이 경계선을 형성하지 않을수도 있으므로 이를 연결해야 한다. 마지막으로 기본적인 폴리곤의 위상을 생성한다.
3. 속성 연결
속성을 연결할 대상물에 고유한 식별자(identifier)가 있는 경우 속성을 자동으로 연결할 수 있다. 벡터 데이터의 경우 속성자료는 각각의 대상물에 직접적으로 연결되지만 래스터 자료의 경우 모든 셀이 한꺼번에 연결된다.
4. 래스터화 및 벡터화
일련의 공간자료 분석작업이 대부분 또는 전부 래스터 자료로 이루어진다면 입수된 벡터자료를 래스터로 변환해야 한다. 이러한 절차를 래스터화라고 한다. 래스터화 과정은 벡터 형태의 점, 선, 면, 속성값을 해당 위치의 래스터 셀의 값으로 지정하는 과정을 의미한다. 이 과정에서 기하학적 해상도를 잘 고려하여 래스터의 해상도를 결정해야 한다. 셀의 크기가 너무 클 경우 하나의 셀에 어려 벡터대상이 중복되어 해당 셀에 어떠한 값을 부여하여야 할지 결정하기 어려울 수 있다. 반대로 셀의 크기가 너무 작아 래스터의 해상도가 높게 되면 파일 크기가 커지는 결과를 가져올 수 있다.
일부 래스터화 과정은 일련의 퇴행 과정이라고도 할 수 있다. 즉, 벡터 경계선을 통합하여 래스터 셀을 생성하면 본래의 정확한 기하학적 위치를 근사값으로 바꾸는 결과가 된다. 그럼에도 불구하고 기존에 확보해 놓은 자료가 래스터 데이터이거나 벡터화하기 어려운 래스터와 통합해서 사용해야 할 경우에는 래스터화가 필수적이다.
다른 방법으로 자료준비단계에서 래스터화를 수행하지 않고 지리정보시스템이 보유하고 있는 실시간 래스터화 기능을 사용하는 방법도 있다. 이렇게 하면 벡터자료는 그대로 보관 가능하고 필요시에만 래스터 자료로 만들수 있는 장점이 있다.
이와 반대로 벡터화, 래스터자료로부터 벡터 자료를 만드는 작업이 있다. 대표적으로 원격탐사 영상으로부터 대상물이나 패턴을 알아내는 형태의 벡터화 과정이 있는데 이를 대상물 추출(feature extraction), 또는 패턴 인식(pattern recognition)이라 한다.
5. 위상의 생성
벡터자료로부터 폴리곤을 생성하는 과정 외에도 다른 종류의 위상관계가 필요할 수 있다. 네트워크에서 어떤 대상이 어떤 대상과 연결되는지, 연속된 네트워크 선의 방향은 어느 쪽인지, 어떤 선이 고가도로이고 어떤 선이 지하도로인지와 같은 것들이 그러한 예시들이라 할 수 있다. 폴리곤의 경우에는 면의 포함관계를 결정해야 하는 문제가 이에 해당할 수 있다. 이러한 내용은 대부분 자료의 의미론적(semantic) 해석에 대한 질문으로서 인간이 직접 해석해야 하는 경우가 대부분이라 할 수 있다.