python菜鸟:需要用python写一个脚本,调用msys.bat(git版本控制器)实现从服务器下载代码的功能。

python菜鸟:需要用python写一个脚本,调用msys.bat(git版本控制器)实现从服务器下载代码的功能。,第1张

假设运行msysbat选择1,即输入字符1

oschdir(r'D:\sms\Mms')

para=r'1'

cmdSvnUpdate = r'echo %s|msysbat'%para

handle = ossystem(cmdSvnUpdate)

其中para为选择相应命令要输入的字符

用MFC的CInternetFile,CInternetSession,CHttpConnection等类,已知服务器名及文件路径,代码越简单越好。

以下是代码片段:

//Download http file through proxy

//--------------------------------------------------------------------------------

We can find details about Proxy Authentication and Sever Authentication methed in MSDN

Just search for the keyword "INTERNET_OPTION_USERNAME"

Here I give a very simple example It works in my project

CString GeHttptFile(const char url)

{

CString szContent;

char strProxyList[MAX_PATH], strUsername[64], strPassword[64];

//in this case "proxya" is the proxy server name, "8080" is its port

strcpy(strProxyList, "proxya:8080");

strcpy(strUsername, "myusername");

strcpy(strPassword, "mypassword");

DWORD dwServiceType = AFX_INET_SERVICE_HTTP;

CString szServer, szObject;

INTERNET_PORT nPort;

AfxParseURL(url, dwServiceType, szServer, szObject, nPort);

CInternetSession mysession;

CHttpConnection pConnection;

CHttpFile pHttpFile;

pConnection = mysessionGetHttpConnection(szServer,

INTERNET_FLAG_KEEP_CONNECTION,

INTERNET_INVALID_PORT_NUMBER,

NULL, NULL);

pHttpFile = pConnection->OpenRequest("GET", szObject,

NULL, 0, NULL, NULL,

INTERNET_FLAG_KEEP_CONNECTION);

//here for proxy

INTERNET_PROXY_INFO proxyinfo;

proxyinfodwAccessType = INTERNET_OPEN_TYPE_PROXY;

proxyinfolpszProxy = strProxyList;

proxyinfolpszProxyBypass = NULL;

mysessionSetOption(INTERNET_OPTION_PROXY, (LPVOID)&proxyinfo, sizeof(INTERNET_PROXY_INFO));

pHttpFile->SetOption(INTERNET_OPTION_PROXY_USERNAME, strUsername, strlen(strUsername)+1);

pHttpFile->SetOption(INTERNET_OPTION_PROXY_PASSWORD, strPassword, strlen(strPassword)+1);

pHttpFile->SendRequest(NULL);

DWORD nFileSize = pHttpFile->GetLength();

LPSTR rbuf = szContentGetBuffer(nFileSize);

UINT uBytesRead = pHttpFile->Read(rbuf, nFileSize);

szContentReleaseBuffer();

pHttpFile->Close();

delete pHttpFile;

pConnection->Close();

delete pConnection;

mysessionClose();

return szContent;

}

bool SaveUrl(LPCTSTR url, LPCTSTR filename)

{

HINTERNET hNet = ::InternetOpen("Outlook",

PRE_CONFIG_INTERNET_ACCESS,

NULL,

INTERNET_INVALID_PORT_NUMBER,

0) ;

HINTERNET hUrlFile = ::InternetOpenUrl(hNet,

url,

NULL,

0,

INTERNET_FLAG_RELOAD,

0) ;

char buffer[101024] ;

DWORD dwBytesRead = 1;

BOOL bRead=TRUE;

CFile file;

fileOpen(filename,CFile::modeCreate|CFile::modeWrite);

while(bRead&&dwBytesRead>0)

{

bRead = ::InternetReadFile(hUrlFile,

buffer,

sizeof(buffer),

&dwBytesRead);

if(dwBytesRead>0)

fileWrite(buffer,dwBytesRead);

}

::InternetCloseHandle(hUrlFile) ;

::InternetCloseHandle(hNet) ;

fileClose();

AfxMessageBox("finished");

return bRead;

}

void CC02021101Dlg::OnOK()

{

// TODO: Add extra validation here

bool bret=SaveUrl("http://clubpchomenet/bbs2phptopic=40&lanmuid=2","C:\\temp\\testhtml");

if(bret)

AfxMessageBox("true");

else

AfxMessageBox("false");

}

下载事件说明:

OnDownloadBegin <--开始下载

OnDownloadComplete <--下载结束

OnDocumentComplete <--页面下载完毕

对于每个HTML页面,顺序都是如此如果是Frame或IFrame的文件都会当成HTML页面处理也就是说如果一个页面中有3个IFrame,那么总共会触发4次BeforeNavigate2事件

对于每个连接且需要显示出来的二进制文件(如gif,bmp,jpg)都会触发一个DownloadBegin和DownloadComplete事件

那我们怎么判断是否全部下载完毕呢嘿嘿,TWebBrowser控件不是有一个Busy属性的吗包括相关文件:

#include

#include

#import

做成了:

Bool GetFromWeb(LPSTR pURL, LPSTR

SaveAsFilePath )

{ CInternetSession session; //会话期对象)

CHttpConnection pServer = NULL; // 指向服务器地址(URL)

CHttpFile pHttpFile = NULL; // HTTP文件指针

CString strServerName; //服务器名

CString strObject; //查询对象名(http文件)

INTERNET_PORT nPort; //端口

DWORD dwServiceType; //服务类型

DWORD dwHttpRequestFlags = //请求标志

INTERNET_FLAG_EXISTING_CONNECT

INTERNET_FLAG_NO_AUTO_REDIRECT;

const TCHAR szHeaders[] = _T("Accept: text/\r\nUser-Agent: HttpClient\r\n");

BOOL OK=AfxParseURL( //词法分析

pszURL, //被分析URL串

dwServiceType, //服务类型,ftp,http等

strServerName, //服务器名

strObject, //URL中被查询对象

nPort ); //URL指定的端口,可能为空

OK=OK && //本例只考虑http协议

(dwServiceType ==

INTERNET_SERVICE_HTTP);

if (!OK)

{ AfxMessageBox("URL出错"); //报错

return false;

}

pServer = sessionGetHttpConnection(strServerName, nPort); /获得服务器名

pHttpFile = pServer-> OpenRequest( CHttpConnection::HTTP_VERB_GET,strObject, NULL, 1, NULL, NULL,dwHttpRequestFlags);

//向服务器发送请求,建立http连接,

//建立本机上的http文件指针

pHttpFile->AddRequestHeaders(szHeaders);

pHttpFile->SendRequest(); //发送请求

CStdioFile f; //输出文件对象

if( !fOpen( //打开输出文件

SaveAsFilePath, CFile::modeCreate | CFile::modeWrite | CFile::typeText ) )

{ MessageBox( "Unable to open file";

return false;

}

//下面将检索结果保存到文件上

TCHAR szBuf[1024]; //缓存

while (pHttpFile->ReadString(szBuf, 1023))

fWriteString( szBuf );

fClose(); //善后工作

pHttpFile ->Close();

pServer ->Close();

if (pHttpFile != NULL) delete pHttpFile;

if (pServer != NULL) delete pServer;

sessionClose();

return true;

}

1迅雷是什么?

迅雷是基于P2SP的一款下载软件,能够大大增强下载速度,可谓迅雷不及掩耳盗铃之势

如破竹。

P2SP的道理不复杂,就是指:如果多个服务器上有某个相同的文件,当某个用户下载其

中一个服务器上的这一文件时,迅雷会自动查找到另外的几个服务器,同时下载这一文

件,达到提速的目的。

迅雷比较流氓,在用户没有得到任何提示毫不知情的情况下,偷偷上传用户的本地文件

,在所有网络流量的统计中排到了第7位。(注:CERNET上似乎可以进三强)

迅雷比较小气,不说源代码不是公开的,连原理也不公开。

迅雷比较聪明,她的架构让人佩服啊佩服,佩服啊佩服,佩服啊佩服……

2下载原理

还记得百度的mp3搜索么?你到mp3baiducom上搜索一个mp3,百度会给你列出她知道的

所有服务器列表(这些服务器都是别人的),你可以在百度上点击该连接下载mp3,而不

用登陆真正的服务器。

迅雷就是把这个过程自动化了,并且增加了判断文件唯一性的功能,画个图简单说明一

下:

1.用户点击1234上的QQ_1exe文件的连接

2.用户客户机上的迅雷得到该文件的唯一的校验值。

3.迅雷自动向自己的资源服务器上搜索,查找到存放同一文件的其他的服务器列表

4.得到文件在该服务器上的目录和文件名(红色部分,有可能和原始连接中的文件名不

相同),ftp://1235/QQ_2exe,http://1236/QQ_3exe,以及公网用户1237

有QQexe

5.迅雷自动向1235和1236上下载该文件的不同文件块,以达到加速下载的目的(

紫色部分)。

6.用户向公网用户1237发送一个UDP资源请求

7.1237回应一个资源请求说:偶这儿有你要的文件

8.用户向公网用户1237的3077端口发起请求,并传输数据。

9.下载完毕后,如果迅雷资源服务器上,该文件的服务器列表中没有目前用户点击下载

的服务器1234,则将这个新的服务器地址加入到该文件的服务器列表(蓝色部分)。

注:

1.上述过程中的6、7、8步骤中隐含了一个过程:判断用户是否是公网用户。

如果是公网用户,则该用户的IP地址和提供下载服务的端口也将记录在迅雷的资源服务

器中,后续用户可以从该用户处下载;第三节有这个过程的说明。

2.迅雷如何区分不同的文件?很多文件名字不同但是内容相同,很多文件名字相同但是

内容不同。搜索迅雷的相关信息只是得到了几句无关痛痒的废话:迅雷还使用了独创的

文件校验机制,保证了用户下载文件的正确性和完整。至于什么方法不得而知

3.我们如何查看迅雷搜索到的资源列表?

在迅雷搜索到一系列的资源列表并且任务没有完成时,会在相同下载目录下建立一个临

时文件,里面有搜索到的资源信息,其中peer就是搜索到的包含要下载文件的公网用户

3协议解析

分析第二节原理图中的下载过程,第1、2、5步和正常的下载是一模一样的,我们无法根

本无法区分。那好,我们就在3、4、6上做文章。

除了上述用户下载一个具体文件的过程的各个报文外,还有交换资源信息报文,用户和

用户之间的文件块传输报文、判断用户是否是公网用户的报文等。

1.资源请求报文

每次迅雷都会向21913413247的tcp端口3076发出资源请求,该地址是写死在迅雷软件

中的,并非依靠DNS请求得到。

如果该地址不可用,则会切换到另外两个可替换的地址21913413242、219134132

86。

Web迅雷则使用21913413246。

过滤掉这个报文,那么迅雷客户端就无法完成资源请求,无法从多点下载。用TP过滤掉

报文后迅雷只能从原始连接下载,如下图:

协议报文特征如下:

2.资源搜索回应报文

过滤掉这个报文,那么迅雷客户端就无法得到资源列表,无法从多点下载。

协议报文特征如下:

3.用户之间的文件传输(握手报文)

用户之间是可以传送文件块的,下面的报文就是传送文件块开始之前的握手报文,

3077端口为客户端的监听端口,用来把本地的文件传输给别人。(如果3077不能用,会

转到其他端口)

4.用户之间资源信息交换报文

5.提交新的资源信息报文

6.连接NAT测试服务器报文

迅雷每过几分钟就会向statnat1sandainet发送NAT测试报文,也就是告诉迅雷的资源

务器,自己是否是公网IP

该报文由于无返回报文,所以猜想采用的办法是采用STUN的方法:

将本机的IP地址放在UDP的payload里,如果迅雷的服务器收到报文发现IP层的源地址

和payload里的IP地址一致,那么就是公网地址,否则就是处于防火墙后面或者需要经

NAT才能上公网。

协议报文如下:

注:

sandainet是xunlei旗下的一个网站,很少单独抛头露面,多出现在迅雷软件检索关联

信息、显示广告的DNS请求报文中。

4TP过滤

如果TP武断的对迅雷进行过滤,只需要设定一个traffic management,把目的地址为21

91341320/24网段,目的端口为3076的报文全部过滤就可以防止迅雷下载,但是有可

能会误报。下面的规则更详细一点,可以减少误报。

1.针对用户向服务器资源请求报文和资源回应报文的过滤

由于迅雷的服务器IP地址比较容易更换,所以建议过滤的DV:

协议:tcp

源端口/目的端口:3076

开始的四个字节:0x29000000

2.针对用户之间的资源信息交互报文的过滤

协议UDP

端口3076

前四个字节0x32000000

3.针对用户之间的文件传输(握手报文)的过滤

协议tcp

源端口或者目的端口可以为3077、3078

前四个字节为0x29000000

4.提交新的资源信息的报文的过滤

协议TCP

目的端口3076

前四个字节0x29000000

5.针对连接NAT测试服务器的报文的过滤

协议UDP

目的端口3076

前四个字节0x00000101

参考资料:

http://zhidaobaiducom/question/18314460html

首先你要知道服务器的IP地址,再知道用户名和密码,以及相应的ftp端口。常用的是21端口,都填写在FTp软件中,然后应用,连接。连接上就会看到服务器上面的网站代码,将其全部下载到本地,你如果懂代码,就自己怎么改就怎么改,不懂可以问别人。做好之后再传上去。就行了,代码改动最好在本地先通过测试。再更新!

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
网站模板库 » python菜鸟:需要用python写一个脚本,调用msys.bat(git版本控制器)实现从服务器下载代码的功能。

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情