RSS
 

Питон, начало

21 Июн


Вот решил написать скрипт для автоматической пингации и обновления простой rss ленты. Решил писать на питоне, а управление настроить под Линуксовый bash с использованием crontab. Питон сам до этого не изучал. Да и выбор пал на него абсолютно случайно. Ну , что ж начали и поехали.  Но , как обычно и бывает в начале столкнулся с достаточно тривиальными сложностями. Поэтому  планирую создать совокупность прикладных постов посвящённых подготовительным этапам через , которое пришлось пройти. Также отмечу, что сразу бросилось в глаза…

Для начала рекомендую сразу почитать википедию и только потом искать специализированную литературу. Особенно полезно должно быть людям, которые знакомы с другими языками программирования. Быстро и сразу получите полный обзор всего необходимого для начала.

Так как нам нужен автономный скрипт на питоне, который к тому же будет управляться crontab Линукса, то надо создать исполняемый файл. Для этого надо в начало скрипта следует поместить директиву:

#!/usr/bin/env python

Здесь подразумевается , что путь к интерпритатору включён в переменную PATH пользователя. Но здесь мне не понравилось то, что скрипт будет платформозависимым. Что для сайтов с хостингом под управлением Денвера не есть хорошо.

Но выход нашёлся через минуту. Надо было получить компилированный файл с расширением «.pyc». В общем случае для ускорения запуска программ и создают байт- компилированную версию. Т.е. если у вас есть файл pythonscript.py содержащий необходимые директивы языка питон. То после компиляции у вас в той же директории появится файл с расширением pythonscript.pyс . Если вы изменили исходный файл, то при последующей компиляции файл pythonscript.pyс будет игнорироваться. Содержание байт-компилированных файлов является платформо-независимым (но может отличаться для разных версий питона). Это очень полезное свойство в случае хостинга тех же сайтов. Кто знает куда нас заведёт великое SEO-webmaster деятельность.

Кроме того, в дополнение необходимо будет передавать параметры из командной строки этим скриптам. Ну например пути вебстраниц, которые будут записаны процедурой find под Линукс. Или аналогичным скриптом под ПХП или …. Просто за время создания программ на сях и баше Линукса – Я усвоил важное упровления о разделение частей программы по различным файлам и дальнейшего их соединения центровйо программой. Это очень удобно в случае написания чего либо, что будет динамически меняться в перспективе да и вспоминать свой труд в таком случае гораздо проще. Особенно после месяцев….

Для того, чтобы передавать параметры скрипту под питон из коммандной строки существуют специальные параметры – такие как

sys.argv

, которая является списком строк. Его длина всегда от единицы и до величины, ограниченной желанием .
Вот пример первого скрипта с необходимым базовым функционалом
pythonscript.py:

import sys
str=sys.argv[1]
print str

так я его компилирую: (конечно выдаётся ошибка, но файл с расширением .pyc создаётся, что и надо)

>>> import pythonscript

Затем надо просто в командной строке  набрать (следует помнить, что необходимо указывать полный путь , где находится байт-компилированный файл)

pythonscript.pyc rss

и будет выведено:

rss

Что ж здесь было главное базовый функционал освоить. Дальше буду описывать как работать с регулярными выражения re. Как никак хтмл страницу придётся анализировать.

Google Bookmarks Reddit Technorati Yahoo My Web БобрДобр.ru Memori.ru МоёМесто.ru
 

Прокомментировать

 
 
 
Система Orphus

Enter your email address:

Delivered by FeedBurner

.