2012-01-27
PHP Simple HTML DOM Parser를 이용한 것으로, 제목에는 이미지 파서라고 되어 있지만, 필자가 아래 예제 파일에서 이미지 파서로 사용 햇을뿐, 다른것들도 얼마든지 수집할 수 있다. 일단 아래의 링크로 가서 파일을 다운 받는다. (안 받아지는 사람은 첨부파일에서 받아도 된다.)
다운로드 : http://sourceforge.net/projects/simplehtmldom/files/

그리고 해당 메뉴얼이 궁금하다면 아래를 참조해보아라.
메뉴얼 : http://simplehtmldom.sourceforge.net/manual.htm

그래도 처음 사용자를 위해서 간단한 예제를 보여주자면
include_once('./simple_html_dom.php'); 
 
$url = "http://www.naver.com"; //자신이 원하는 페이지
$html = file_get_html( $url ); 
  
$images = array(); 
foreach($html->find('img') as $element) //이미지 태그의 주소를 찾아 배열에 저장
    $images[] = $element->src; 

reset($images);

foreach ($images as $out) //저장된 배열의 내용을 출력해주는 부분
 echo "<a href='$out' target='_blank'> $out </a><br><img src='$out'><br><br>\n";
식으로 사용하면 되겠다.
여러가지 파일들이 있겠지만 simple_html_dom.php이 핵심파일이니 해당 파일만 include 해서 쓰면 될것이다.
그리고 위 소스는 해당 img파일의 링크를 긁어모은것이기 때문에 해당 이미지 자체를 저장하고 싶다면, snoopy와 같은 소켓클래스를 이용해서 저장하면 될것이고, 이 소스를 잘 응용한다면 웹 크롤러로도 쓸수 있을것이다.

참고로 해당 소스에는 error_get_last() 와 같은 함수가 포함되어 있기 때문에, php 5.2 이상인 버전이 아닐 경우에는 종종 에러가 뜰수도 있다는것을 알아두길 바란다.