建設工程教育網(wǎng) > 建筑文苑 > 建筑電氣 > 正文
2007-01-25 13:41 【大 中 小】【打印】【我要糾錯】
1、博弈論概述
博弈論又稱(chēng)為“對策論”,一種使用嚴謹數學(xué)模型來(lái)解決現實(shí)世界中的利害沖突的理論。由于沖突、合作、競爭等行為是現實(shí)世界中常見(jiàn)的現象,因此很多領(lǐng)域都能應用博弈論,例如軍事領(lǐng)域、經(jīng)濟領(lǐng)域、政治外交,解決諸如戰術(shù)攻防、國際糾紛、定價(jià)定產(chǎn)、兼并收購、投標拍賣(mài)甚至動(dòng)物進(jìn)化等問(wèn)題。
博弈論的研究開(kāi)始于本世紀,1944年諾依曼和摩根斯坦合著(zhù)的《博弈論和經(jīng)濟行為》一書(shū)的出版標志著(zhù)博弈理論的初步形成,隨后發(fā)展壯大為一門(mén)綜合學(xué)科。1994年三位長(cháng)期致力于博弈論研究實(shí)踐的學(xué)者納什、海薩尼、塞爾頓共同獲得諾貝爾經(jīng)濟學(xué)獎,使博弈論在經(jīng)濟領(lǐng)域中的地位和作用得到權威性的肯定。
2. 博弈論的基本原理和方法
文獻[1][2]用淺白的語(yǔ)言敘述了博弈論的思想精髓和基本概念。文獻[3][4]更注重理論上的分析和數學(xué)的嚴謹。概括起來(lái),博弈論模型可以用五個(gè)方面來(lái)描述
G={P, A, S, I, U}
P: 為局中人,博弈的參與者,也稱(chēng)為“博弈方”,局中人是能夠獨立決策,獨立承擔責任的個(gè)人或組織,局中人以最終實(shí)現自身利益最大化為目標。
A: 為各局中人的所有可能的策略或行動(dòng)的集合。根據該集合是否有限還是無(wú)限,可分為有限博弈和無(wú)限博弈,后者表現為連續對策,重復博弈和微分對策等。
S:博弈的進(jìn)程,也是博弈進(jìn)行的次序。局中人同時(shí)行動(dòng)的一次性決策的博弈,成為靜態(tài)博弈,如齊威王和田忌賽馬;局中人行動(dòng)有先后次序,稱(chēng)為動(dòng)態(tài)博弈,如下棋。
I: 博弈信息,能夠影響最后博弈結局的所有局中人的情報,如效用函數,響應函數,策略空間等。打仗強調“知己知彼,百戰不殆”,可見(jiàn)信息在博弈中占重要的地位,博弈的贏(yíng)得很大程度依賴(lài)于信息的準確度與多寡。得益信息是博弈中的重要信息,如果博弈各方對各種局勢下所有局中人的得益狀況完全清楚,稱(chēng)之為完全信息博弈(game with complete information),例如齊威王和田忌賽馬,各種馬的組合對陣的結果雙方都不嚴而喻。反之為不完全信息博弈(game with incomplete information),例如投標拍賣(mài),博弈各方均不清楚對方的估價(jià)。在動(dòng)態(tài)博弈中還有一類(lèi)信息:輪到行動(dòng)的博弈方是否完全了解此前對方的行動(dòng)。如果完全了解則稱(chēng)之為“具有完美信息”的博弈(game with perfect information),例如下棋,雙方都清楚對方下過(guò)的著(zhù)數。反之稱(chēng)為“不完美信息的動(dòng)態(tài)博弈”(game with imperfect information)。由于信息不完美,博弈的結果只能是概率期望,而不能象完美信息博弈那樣有確定的結果。
U:為局中人獲得利益,也是博弈各方追求的最終目標。根據各方得益的不同情況,分為零和博弈和變和博弈。零和博弈中各方利益之間是完全對立的。變和博弈有可能存在合作關(guān)系,爭取雙贏(yíng)的局面。
還有另一類(lèi)型博弈稱(chēng)為多人合作博弈,例如安理會(huì )投票表決,OPEC聯(lián)合限產(chǎn)保價(jià)等問(wèn)題。這類(lèi)問(wèn)題重點(diǎn)放在聯(lián)盟利益的分配上,它的理論和方法廣泛應用于利益損失的共同分擔問(wèn)題。多人合作博弈的研究方法主要是特征函數模型。以個(gè)可能的聯(lián)盟為定義域,特征函數表示各個(gè)聯(lián)盟的得益(N是局中人的數目),它的分配解必須符合一定的合理性和穩定性,它的解的概念也發(fā)展成多種多樣,包括穩定集、核心、核仁、Shapely值等。解的多樣性符合現實(shí)世界復雜多樣的需要,針對不同的問(wèn)題選擇或創(chuàng )造合適的解的概念是博弈論深入研究的課題。
不管博弈各方是合作、競爭、威脅還是暫時(shí)讓步,博弈論模型的求解目標就是使自身最終的利益最大化,這種解建立在對方也采取各自“最好策略”為前提,各方最終達到一個(gè)力量均衡,也就是說(shuō)誰(shuí)也無(wú)法通過(guò)偏離均衡點(diǎn)而獲得更多的利益。這就是博弈論求解的本質(zhì)思想。
3、博弈論與電力市場(chǎng)
博弈論是研究市場(chǎng)經(jīng)濟的重要工具。電力作為特殊的商品,它的生產(chǎn)、運輸、銷(xiāo)售和消費也逐漸走向市場(chǎng)化。世界范圍內很多國家的電力工業(yè)走向放松管制、引進(jìn)競爭的進(jìn)程中,遇到很多前所未有的新課題,運用博弈論來(lái)分析解決其中一些問(wèn)題是一個(gè)研究方向。 用博弈論模擬電力市場(chǎng),模擬的結果可能更加接近實(shí)際,為市場(chǎng)模式設計提供依據。另外,電廠(chǎng)或用電用戶(hù)作為市場(chǎng)的參與者,可以用博弈論來(lái)分析市場(chǎng),研究如何報價(jià)獲利最大。
正確運用博弈論關(guān)鍵要針對電力市場(chǎng)的特點(diǎn)正確選擇模型和解的概念。例如:力量相當的兩個(gè)區域電網(wǎng)之間交換功率的情形比較適合用古諾模型和Nash談判解方法;而自備電廠(chǎng)與公用電網(wǎng)之間的交易可能更適合用Stackleberg模型。還有局中人結盟問(wèn)題:如何識別合作伙伴,結盟利益如何在聯(lián)盟內分配。電力市場(chǎng)環(huán)境下,電網(wǎng)輸電作為一項服務(wù),它的網(wǎng)損、固定資產(chǎn)投資如何在網(wǎng)絡(luò )使用者之間分擔。這些分配問(wèn)題有不同的概念的解:穩定集,核心,核仁,Shapely值等,如何合理選擇或創(chuàng )造最接近實(shí)際的解的概念也是面臨的課題。
博弈的結果是依賴(lài)于擁有的信息,采用什么樣的信息披露政策是設計電力市場(chǎng)模式的一個(gè)方面。例如:電廠(chǎng)競價(jià)上網(wǎng),一個(gè)成功的報價(jià)不僅取決于自己的實(shí)力,還有賴(lài)于他人如何報價(jià)。但是各方往往不清楚互相之間成本、報價(jià)等信息,因為這些信息都是各自的商業(yè)秘密。如何處理這種信息既不完全也不完美的博弈是一個(gè)重要的課題。反過(guò)來(lái),博弈的實(shí)驗結果也為電力市場(chǎng)披露怎樣的信息提供依據。
博弈論和電力市場(chǎng)理論都是很年輕的科學(xué),兩者都有廣闊的發(fā)展天地,兩者的結合可以互相促進(jìn)。
4、博弈論在電力市場(chǎng)中的應用
4.1自備電廠(chǎng)與公用電網(wǎng)之間的交易
開(kāi)放發(fā)電市場(chǎng)的進(jìn)程中,擁有自備電廠(chǎng)的用戶(hù)是一類(lèi)特殊的市場(chǎng)參與者,它既是用電用戶(hù),也可以是電力的供應者。隨著(zhù)電力市場(chǎng)深入發(fā)展和工業(yè)的進(jìn)步,自備電廠(chǎng)將成長(cháng)為一支生力軍。
文獻[5]用博弈論來(lái)分析評價(jià)在分時(shí)定價(jià)的環(huán)境下?lián)碛凶詡潆姀S(chǎng)的用戶(hù)(NCP)對定價(jià)的影響作用。NCP既可以從公用電網(wǎng)購電,也可以自己發(fā)電來(lái)滿(mǎn)足自身需求。為解決兩者的沖突,作者提出了三種博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者構造了三個(gè)局中人:公用電網(wǎng),普通用戶(hù),帶自備電廠(chǎng)的用戶(hù)(NCP),并且假設它們的需求函數、邊際成本、收益函數等均是線(xiàn)性的,通過(guò)數字模擬得出了一些有趣的結果:①NCP的加入促使公用電網(wǎng)降低出售給NCP的電價(jià);②沖突還使普通用戶(hù)得到更多益處。該文為解決自備電廠(chǎng)與公用電網(wǎng)的相互作用提供了很有用的分析思想。但是尚有三點(diǎn)可以進(jìn)一步改進(jìn):①該文尚未考慮NCP將自己多余的自發(fā)電賣(mài)給公用電網(wǎng)的情況;②該文將公用電網(wǎng)和NCP置于平等的市場(chǎng)地位可能不符合實(shí)際市場(chǎng),如果公用電網(wǎng)規模很大,NCP數目很多但規模小,考慮Stackerlberg模型更符合兩者實(shí)際;③該文假設公用電網(wǎng)的目標函數是整個(gè)社會(huì )利益最大化,而并非是自身利益最大化,這個(gè)假設不符合電力市場(chǎng)需要解除管制的發(fā)展方向。
文獻[ 6]部分解決了以上問(wèn)題,它重點(diǎn)放在自備電廠(chǎng)和公用電網(wǎng)相互作用的方式的選擇:公用電網(wǎng)回購NCP多余電力(buy-back system)或者公用電網(wǎng)收取NCP運轉電力的過(guò)網(wǎng)費(wheeling charges)。該文分析了在不同市場(chǎng)環(huán)境下,各方的得益情況,得出了一些可能只有用博弈論才能得出的結論。
4.2區域間輸電交易分析
互聯(lián)網(wǎng)間短期電力交換是一種經(jīng)濟運行的手段。白曉民等在文獻[7]中應用Nash博弈論來(lái)分析簡(jiǎn)單的兩區域系統單時(shí)段交易分析,得出雙方都可接受的交換功率和交易價(jià)格。在此基礎上,文獻[8]提出了一種兩階段迭代計算方法來(lái)處理外部交易計劃與內部經(jīng)濟調度的協(xié)調。該文所用的博弈模型是二人非零和對策,采取合作型對策,應用 Nash談判公理作為仲裁程序,決策出雙方都可接受的交換功率和交易價(jià)格。應該指出,白曉民等的分析是基于完全信息的博弈也即博弈雙方均對對方在各種情況下的得益了解非常清楚。如果缺少這方面的信息,又應該如何分析處理呢?這個(gè)問(wèn)題值得進(jìn)一步深入探究。
4.3轉運市場(chǎng)中電網(wǎng)的固定成本分攤問(wèn)題
運轉市場(chǎng)中一個(gè)難題是網(wǎng)絡(luò )輸電服務(wù)定價(jià),這個(gè)定價(jià)能夠給網(wǎng)絡(luò )使用者一個(gè)信號,以達到全網(wǎng)最優(yōu)化;并且能夠補償網(wǎng)絡(luò )的投資者,網(wǎng)損、變動(dòng)成本、固定成本等費用在網(wǎng)絡(luò )使用者中合理分攤;同時(shí)能夠正確激勵網(wǎng)絡(luò )增容。節點(diǎn)實(shí)時(shí)價(jià)格(nodal spot price)制度可以解決網(wǎng)損和網(wǎng)絡(luò )阻塞問(wèn)題。但是文獻[9]的作者認為節點(diǎn)實(shí)時(shí)價(jià)格制度不能完全回收輸電系統的固定投資,為了解決雙邊貿易中輸電系統固定成本公正分攤問(wèn)題,作者提出了基于多人合作博弈模型,可以計算出逐條線(xiàn)路逐筆交易的分攤費用。文中使用“核仁”作為模型的解。該方法的優(yōu)點(diǎn):①使用“核仁”而不用Shapely值,因為“核仁”處于核心,分配值更加穩定和易于被各方接受;②提供了一種激勵,減輕線(xiàn)路過(guò)載。
4.4 基于Pool或PX模式的多邊貿易市場(chǎng)
電力市場(chǎng)環(huán)境下的博弈具有行動(dòng)策略隨機性、信息隱蔽性,這些特點(diǎn)都給建模和計算造成困難,從而限制了實(shí)際應用。各種文獻在處理這種不確定信息環(huán)境下的決策問(wèn)題中,通常需要假設或者估計對方的信息,方法各有特色。
在文獻[10]作者認為在完全競爭的市場(chǎng)環(huán)境下,市場(chǎng)參與者相對于市場(chǎng)規模都顯得很小,市場(chǎng)影響力很小。在這種情況下,優(yōu)化報價(jià)決策不需要博弈的思想。文中作者認為電力市場(chǎng)屬于不完全競爭市場(chǎng),單個(gè)市場(chǎng)參與者對市場(chǎng)是有影響力的,其模型本質(zhì)上屬于不完全信息的非合作博弈。例如:每個(gè)參與者只知道自己的成本信息,而不知道對方的成本等信息。在這種情況下作者提出了這樣的一個(gè)問(wèn)題:在無(wú)法完全了解對方的信息情況下,參與者如何投標(選擇高價(jià)投標還是低價(jià)投標)才能使自己收益最大。該文通過(guò)轉化的方式把不完全信息的博弈變?yōu)樾畔⑼耆煌昝赖膭?dòng)態(tài)博弈來(lái)求解。每個(gè)市場(chǎng)參與者均對自己的對手可能的出價(jià)進(jìn)行分類(lèi),并對每一類(lèi)的可能性進(jìn)行概率估計,形成一個(gè)概率意義上的期望收益矩陣,用Nash平衡點(diǎn)的概念求解矩陣,得到問(wèn)題的解。
文獻[11][12]作者提出了一種談判模型。每一個(gè)局中人進(jìn)行決策時(shí),都同時(shí)執行以下兩個(gè)步驟:①對可能的合作對象按照一定的指標進(jìn)行優(yōu)先排序;②按照談判優(yōu)先順序,逐一進(jìn)行討價(jià)還價(jià),談判的規則與程序是預先設定好的。該文的特色是談判對象的優(yōu)先順序表的形成。排序的準則基于該局中人A對關(guān)于他人的信息的了解程度。先分別對其他局中人的成本信息進(jìn)行分類(lèi),并對每一類(lèi)出現的可能性進(jìn)行概率估計。然后假設與某局中人B進(jìn)行合作,互相交換共享所擁有的信息,聯(lián)合成博弈的一方,剩下的局中人結合為博弈的另一方。這樣的博弈模型的Nash平衡點(diǎn)是概率意義上的期望值,作為與B合作的優(yōu)先指標。對每個(gè)局中人都進(jìn)行一遍以上計算,得到了A的談判對象優(yōu)先順序表。每個(gè)局中人都有自己的一張優(yōu)先順序表。最后按照預先設定的談判規則與程序,各方同時(shí)進(jìn)行合作談判,談判要解決如何合理分配或均衡比單干多出的利益。
該文關(guān)鍵的一點(diǎn):正確掌握對方的成本、策略等信息。各方可能從每一次博弈的結果中得到有用的反饋信息,并用這種反饋來(lái)更新自己的知識庫,提高對他人了認識。遺憾的是作者并沒(méi)有提到如何實(shí)現這樣重要的學(xué)習過(guò)程。該文的模擬算法中的一個(gè)缺點(diǎn):計算量隨局中人的數目和每個(gè)局中人類(lèi)型的數目的增長(cháng)呈指數增長(cháng)。
對于多邊貿易模式的電力市場(chǎng),文獻[13]提出了多代理理論模型,解決貿易合作問(wèn)題,文中的模型基于完全信息的博弈模型。模擬的過(guò)程包括四個(gè)階段:①確定自身成本等信息;②與對方互相交換信息,互相尋求合作伙伴;③按照預先設定的準則和協(xié)議進(jìn)行聯(lián)合分組,形成一個(gè)談判對象優(yōu)先順序表,這個(gè)順序表獲得方法于[11][12]的方法不一樣。作者采用公平性合作標準和Shapely值來(lái)確定這個(gè)順序表;④按照優(yōu)先順序表進(jìn)行雙邊談判。作者認為這四個(gè)階段可以反復迭代進(jìn)行,直至沒(méi)有人愿意改變合作格局為止或者達到預先設定的計算時(shí)間。作者在文中考慮了多種情況,但是模型仍偏于簡(jiǎn)單。
4.5用博弈論解釋和實(shí)現算法
文獻[14]用博弈論來(lái)解釋拉格朗日松弛法法解決機組經(jīng)濟組合的算法。該文認為在電力市場(chǎng)的環(huán)境下,競爭各方均以實(shí)現自身利益最大化為目標,旋轉備用的約束變得軟起來(lái),PX(power exchange)機構可能通過(guò)松弛這一約束進(jìn)一步降低成本。該文提出了一種基于博弈論的算法獲取最優(yōu)的旋轉備用。
作者認為拉格朗日松弛法的拉格朗日乘子是有經(jīng)濟含義的,松弛旋轉備用的乘子 被看作是提供備用的價(jià)格信息,各時(shí)段的旋轉備用根據這個(gè)信息不斷在規定的高低兩種備用水平之間調整(例如:為t時(shí)段負荷)。根據優(yōu)化原理,如果拉格朗日函數存在鞍點(diǎn),則鞍點(diǎn)是原問(wèn)題的最優(yōu)解。
鞍點(diǎn)的概念與博弈論中的Nash平衡點(diǎn)有非常相似之處,如以上公式所示;诖讼敕,作者構造了兩廠(chǎng)商博弈模型。其中一局中人P代表整個(gè)實(shí)際電網(wǎng)的利益,它控制的決策變量是p,u(p向量表示各機組分配的有功,u向量表示機組啟停),目標是使整個(gè)系統成本最低。另一個(gè)局中人Q,是一個(gè)假想的發(fā)電商,它以?xún)r(jià)格向P銷(xiāo)售備用容量和有功容量。雙方就旋轉備用交易進(jìn)行討價(jià)還價(jià),最終達到一個(gè)平衡的交易量和交易價(jià)格。作者證明以上博弈過(guò)程的Nash平衡解就是拉格朗日函數的解;谝陨辖Y論,作者設計了自適應的次梯度算法尋求平衡點(diǎn),其中一個(gè)關(guān)鍵技術(shù)作者設計了廠(chǎng)商P對廠(chǎng)商Q備用容量報價(jià)的反應函數 該函數將 映射到備用容量的兩種水平之間(例如:5%Dt-%Dt,Dtt時(shí)段負荷),形成一個(gè)隨價(jià)格信息變動(dòng)的備用容量。根據廠(chǎng)商Q是否了解廠(chǎng)商P的反應函數,模型可細分為兩種:Nash模型(不了解對方反應函數)和Stackelberg模型(Q了解P的反應函數),作者認為后一種模型掌握的信息較多,因此收斂的速度和優(yōu)化的效果梢好于前一種模型。
用博弈論來(lái)解釋并且設計一些算法是一個(gè)新鮮而具有挑戰性的課題。博弈論本身就是帶有優(yōu)化功能的一門(mén)嚴謹的數學(xué),不過(guò)它更具有人的邏輯思維的色彩,融合了一些用別的方法難以表達的信息。
5、結論
本文在介紹博弈論的基本模型和求解思想與方法的基礎上初步揭示了博弈論在電力市場(chǎng)中的應用狀況,所列文獻一定程度反映了該領(lǐng)域的研究概貌和發(fā)展方向。電力市場(chǎng)本身是一項新興的系統工程,很多問(wèn)題懸而未決,新的問(wèn)題不斷涌現。博弈論作為這項復雜工程的新興的有力工具,必將隨著(zhù)電力市場(chǎng)的深入發(fā)展而發(fā)展。
1、凡本網(wǎng)注明“來(lái)源:建設工程教育網(wǎng)”的所有作品,版權均屬建設工程教育網(wǎng)所有,未經(jīng)本網(wǎng)授權不得轉載、鏈接、轉貼或以其他方式使用;已經(jīng)本網(wǎng)授權的,應在授權范圍內使用,且必須注明“來(lái)源:建設工程教育網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其法律責任。
2、本網(wǎng)部分資料為網(wǎng)上搜集轉載,均盡力標明作者和出處。對于本網(wǎng)刊載作品涉及版權等問(wèn)題的,請作者與本網(wǎng)站聯(lián)系,本網(wǎng)站核實(shí)確認后會(huì )盡快予以處理。
本網(wǎng)轉載之作品,并不意味著(zhù)認同該作品的觀(guān)點(diǎn)或真實(shí)性。如其他媒體、網(wǎng)站或個(gè)人轉載使用,請與著(zhù)作權人聯(lián)系,并自負法律責任。
3、本網(wǎng)站歡迎積極投稿。