RSS
 

Парсер sitemap, карта сайта

14 Апр

Для ускорения процесса создании карты сайта  была разработана следующая программа. После того как получена карта сайта, и есть файл хтмл, содержащий ссылки на все страницы сайта. Затем при помощи этой программы можно легко и просто получить некую совокупность хтмл фалов с фиксированным числом ссылок на страницу.

Результат работы  программы может быть например такой: имеется файл хтмл , содержащий 1000 ссылок карты сайта, появются 20 файлов,каждый их которых содержит по 50 ссылок. Кроме того существует возможность настройки  шаблона. Рекомендую перед использованием обратить внимание на  скриншоты и прочитать описание.

Parser

Главное окно программы парсера

  • Предварительно следует создать карту сайта с использованием любого  sitemapgenerator .  (получаем файл, с расширением *.html и содержащий ссылки на все страницы сайта). Этот  файл карты сайта можно назвать например sitemapgenerated.html.

Запускать можно и с  базовыми настройками. Нужна только карта сайта sitemapgenerated.html, которую будем парсить

Следующие пункты разъясняют пункты программы:

  • Запускаем программу parsesitemap.exe.

  • Настраиваем её.
    {1}- Прописываем полный путь   к sitemapgenerated.html.
    {2}-Указываем путь к директории (sitemapdirectory), где будут находится файлы *.html   карты сайты.
    {3}-название файлов карты сайта т.е. в результате будет получена совокупность файлов *.html ,а именно в нашем случае : sitemap1.html, sitemap2.html, sitemap3.html, sitemap4.html… (каждый будет содержать по 50 ссылок (links per page))
    {4}-Путь к файлу (textfilelinks.txt),который будет содержать список ссылок на <a href=»sitemap1.html»>1</a>,<a href=»sitemap2.html»>2</a>, <a href=»sitemap3.html»>3</a>,<a href=» sitemap4.html»>4</a>… соответственно
  • Также можно задать шаблон файлов sitemap1.html, sitemap2.html, sitemap3.html, sitemap4.html , для этого необходимо копировать соответствующий код в последнее поле, где по умолчанию находится тег <body>.
  • links per page – число ссылок на страницу сооветсвенно, рекомендуется ставить не больше 150.

Все названия можно заменить на свои. Если в результате всё сделано правильно результат должен быть похож на то, что изображено на приведённом ниже скриншоте.

{1} -sitemapgenerated.html {2}-sitemapanomalian {3}- sitemapan {4}- anlinks.txt

Result

В результате получаем файлы хтмл и список ссылок на эти страницы в *.txt

Google Bookmarks Reddit Technorati Yahoo My Web БобрДобр.ru Memori.ru МоёМесто.ru
 
 

Прокомментировать

 
 
  1. Вит.

    11.03.2011 - 02:12

    А зачем карта в хтмл поисковикам, они же ее в тхт и хмл юзают. В формате хмл конечно стоит разбивать, map компонент моего сайта так и делает.
    З.Ы.
    Между вторым и третьим предложением нескладуха, точку лучше заменить на запятую а слово «затем» убрать.

     
  2. kinogrant

    26.06.2013 - 12:02

    Неплохая программа, давно ей пользуюсь!

     
 
Система Orphus

Enter your email address:

Delivered by FeedBurner

.