Архив с исходниками:
http://www.sendspace.com/file/5tvrh1
Система модульная и сейчас там есть ядро с функциями и 2 модуля.
Один из них обьясню:
Parse FAKULTET to LETTER and inser in DB';
echo '
';
//цикл по всем факультетам
for ($i=1;$i<100;$i++){
//вытягиваем з базы один факультет,
//который еще не обрабатывали
$sql="SELECT * FROM fakultet WHERE status='no parsing' LIMIT 1";
$rez=mysql_query($sql);
$count=mysql_num_rows($rez);
//проверяем если нет факультетов необработанных
//то тогда выходим
if ($count==0) break;
//вытягиваем ссылку фака з базы
$rezz = mysql_fetch_array($rez);
//получаем страницу фака через КУРЛ
$page=get_contents('http://www.*.com' . $rezz['href']);
//находим все буквы через регулярку
$pattern="#selelet\('(.)#";
preg_match_all($pattern,$page,$links);
$links=$links[1];
//цикл по всех буквах что вытянули
foreach ($links as $item) {
//вставляем букву в базу
$sql="INSERT INTO letter SET
innerid_fak='{$rezz['innerid']}',
letter='$item',
status='no parsing'";
mysql_query($sql);
}
//делаем пометку, что этот фак обработали
$sql="UPDATE fak SET status='ok' WHERE innerid='{$rezz['innerid']}'";
mysql_query($sql);
echo $rezz['name'].' - OK
';
//выводим все что есть на экран
ob_flush();
//отдыхаем 3 секунды
sleep(3);
}
//выводим низ сайта
footer();
?>
Если будут вопросы задавайте в комментариях.
А сейчас буду писать парсер, что пройдется по всех буквах и вытянет ссылки на группы. В принципе, до ночи должен сделать и в принципе парсер за полчасика все обрабатает. Тогда выложу этот модуль.
А уже завтра буду делать одну с сложнейших задач, а именно авторегер.
