① java開發者開淘寶店做推廣有何優勢求答案
沒啥優勢,一個搞開發的說的難聽點還不如一個搞推廣運維的。估計一個淘寶店小二都比他強。淘寶這東西關鍵還是運維,技術上淘寶都解決了,再說所謂的裝飾跟java技術有啥關系
② 淘寶是用php還是java開發
淘寶第一版是用PHP,後來全面遷移到Java,跑在Linux上現在只有非常小的一部分(比如動態活動頁面)還是php。
③ 淘寶主要是用 Java 實現的,這是真的嗎
據我所知,淘寶是用java做後端的,nodeJS做中間層渲染html,前端使用他們自己的js框架做數據交互的
④ java能開發一個電商應用嗎
當然可以,像阿里、京東都是用java開發的。現在java培訓機構的畢業項目一般都是電商,就是到快學完的時候,都會開發一個電商項目的。
⑤ 淘寶用什麼語言寫的php還是java
早期用PHP的框架PHPAuction搞起來的,由於PHP不支持連接池的方式訪問Oracle資料庫,於是全站用Java改寫了一遍。
⑥ 淘寶和京東商城是用什麼做的是JAVA嗎
淘寶網和京東網都是用JAVA做的,現在這兩個地方都有專門的JAVA開發團隊!JAVA並不是只能做網站,你說的網站屬於電子商務的一部分!JAVA在web方面是很強大的,現在銀行方面的確實很多都用到JAVA
⑦ java開發有前途嗎
java發展這么久肯定還是有前途的,首先Java是一門技術含量比較高的專業,其次涉及的領域也非常廣,下面我們簡單的聊聊。
一、Java開發工程師前途何在:Java的市場規模
80%以上的高端企業級應用都使用Java平台(電信、銀行等)。Java是成熟的產品,已經有20多年的歷史。Amazon、Google、 eBay、淘寶、京東、阿里和其它的大型電子商務品牌都在使用Java來後台處理。這么多企業都青睞Java,主要原因是Java的可擴展性好,可以處理更多的客戶數據。
二、Java開發工程師前途何在:Java稱霸的領域
大型企業級應用,主要使用Java EE,比如大型企業管理系統,最典型的就是:
1.有關通信及網路的大型企業:移動、聯通、電信、網通主要的信息化都是Java
2.有關金融行的大型企業,所有的銀行、證券公司,比如工商銀行、建設銀行;大型管理系統,如:供應鏈、客戶管理系統……
3.電子政務,主要使用Java EE,相關的政府部門絕大多數的信息化系統是Java開發的;
4.游戲,很多手機游戲都是用Java開發的。
5. 嵌入式設備及消費類電子產品,主要用 Java ME或現在很流行的andriod,無線手持設備、通信終端、醫療設備、信息家電(如數字電視、機頂盒、電冰箱)、汽車電子設備等是比較熱門的Java應用領域,這方面的應用例子有中國聯通CDMA 1X網路中基於Java技術的無線數據增值服務——UniJa。
無論是想轉行java大數據還是大學生,怎麼學java很重要,不然浪費金錢和時間這對你來說都是你非常寶貴的,尤其是時間,看看行業大牛的建議吧,少走彎路本身你就已經贏了一半了,這是Java交流口口qun:七三二、三零八、一七四,如果大家對於學習Java的學習方法,如何學習有效率以及就業的問題可以添加群跟大家交流(大神還是非常多的)
三、Java開發工程師前途何在:Java發展前景廣闊
Eclipse Foundation執行董事 Mike Milinkovich表示:Java的未來一定是物聯網,我十分期待Oracle和合作夥伴能夠給出一個基於Java的端到端的存儲解決方案,如果能夠成功的話,那麼未來20年,Java的地位都不會被動搖。
現在這個時代不僅是行業的巨大機會,同時也是Java發展的時機。雖然Java的反對聲音一直都有,但是並沒有阻止Java前進的腳步,相反它會為Java的發展提供前進的方向,我們有理由相信,即使再過20年,Java也不會被打倒。
根據IDC的統計數字,在所有軟體開發類人才的需求中,對Java工程師的需求達到全部需求量的60%~70%。同時,Java工程師的薪水相對較高。通常來說,具有3~5年開發經驗的工程師,擁有年薪10萬元是很正常的一個薪酬水平。
想學Java的同學不要擔心未來的就業市場問題,一個已經被說爛的說法:這個社會永遠缺人,但是缺的是能人. 你需要擔心的是你是否有足夠的興趣去學習編程,並將它作為一份事業來持之以恆。你是否有足夠的耐心還野心去踏上沖擊年薪40萬的征程!
四、Java開發工程師前途何在:Java的持續完善
在Java任務控制套件和Java高級管理控制台的雙重保障下,Java進入到了使用的新紀元,而同樣進入這個紀元的,還有雲計算和物聯網。
作為最常用的雲計算底層開發語言,Java的安全性、開放性、穩定性和跨平台性與雲計算高可靠、高拓展的優勢相得益彰。
五、Java開發工程師前途何在:Java是一門非常好的鋪墊語言
各路大神詬病Java這門語言,強類型,語法結構比較嚴(lei)謹(zhui),但是對於初學者來說,Java還是非常友好的,相對簡單學習周期不會太長,很多人學過Java之後,再學習其他語言感覺非常輕松。
所以就算真的有什麼不測風雲,Java也是一門非常好的鋪墊語言。因為編程思想,設計模是不會被淘汰的!Java的生態圈決定了它在未來10年,甚至20年都會是最熱門的語言之一。如果對編程感興趣可以來我這看看。
希望對您有所幫助!~
⑧ 怎麼用java調用淘寶開發平台獲得淘寶的所有的類目,要詳細的介面
淘寶的API有些是開放的,我查了一下所有類目的API是收費的,需要申請APIKey,然後調用對應查詢介面,就能返回XML或JSON數據進行自己的處理了。
如果真是開發需要,就可以買淘寶的服務啊。
調用很簡單,比如taobao.itemcats.get 介面(獲取後台供賣家發布商品的標准商品類目),如下Java代碼就返回結果了(前提是提供APIKey,需要申請審核)
TaobaoClientclient=newDefaultTaobaoClient(url,appkey,secret);
ItemcatsGetRequestreq=newItemcatsGetRequest();
req.setFields("cid,parent_cid,name,is_parent");
req.setParentCid(50011999L);
req.setCids("18957,19562,");
ItemcatsGetResponseresponse=client.execute(req);
另外,變通的方法是自己開發爬蟲,在淘寶頁面上抓取,但問題是得不到淘寶技術支持,比如淘寶改版後也得跟著改動爬蟲代碼。
⑨ 使用java語言爬取自己的淘寶訂單看看買了哪些東西
Java爬蟲框架WebMagic簡介及使用
一、介紹
webmagic的是一個無須配置、便於二次開發的爬蟲框架,它提供簡單靈活的API,只需少量代碼即可實現一個爬蟲。webmagic採用完全模塊化的設計,功能覆蓋整個爬蟲的生命周期(鏈接提取、頁面下載、內容抽取、持久化),支持多線程抓取,分布式抓取,並支持自動重試、自定義UA/cookie等功能。
二、概覽
WebMagic項目代碼分為核心和擴展兩部分。核心部分(webmagic-core)是一個精簡的、模塊化的爬蟲實現,而擴展部分則包括一些便利的、實用性的功能(例如註解模式編寫爬蟲等)。
WebMagic的結構分為Downloader、PageProcessor、Scheler、Pipeline四大組件,並由Spider將它們彼此組織起來。這四大組件對應爬蟲生命周期中的下載、處理、管理和持久化等功能。而Spider則將這幾個組件組織起來,讓它們可以互相交互,流程化的執行,可以認為Spider是一個大的容器,它也是WebMagic邏輯的核心。
2.1 WebMagic的四個組件
Downloader
Downloader負責從互聯網上下載頁面,以便後續處理。WebMagic默認使用了Apache HttpClient作為下載工具。
PageProcessor
PageProcessor負責解析頁面,抽取有用信息,以及發現新的鏈接。WebMagic使用Jsoup作為HTML解析工具,並基於其開發了解析XPath的工具Xsoup。在這四個組件中,PageProcessor對於每個站點每個頁面都不一樣,是需要使用者定製的部分。
Scheler
Scheler負責管理待抓取的URL,以及一些去重的工作。WebMagic默認提供了JDK的內存隊列來管理URL,並用集合來進行去重。也支持使用Redis進行分布式管理。除非項目有一些特殊的分布式需求,否則無需自己定製Scheler。
Pipeline
Pipeline負責抽取結果的處理,包括計算、持久化到文件、資料庫等。WebMagic默認提供了「輸出到控制台」和「保存到文件」兩種結果處理方案。Pipeline定義了結果保存的方式,如果你要保存到指定資料庫,則需要編寫對應的Pipeline。對於一類需求一般只需編寫一個Pipeline。
2.2 用於數據流轉的對象
Request
Request是對URL地址的一層封裝,一個Request對應一個URL地址。它是PageProcessor與Downloader交互的載體,也是PageProcessor控制Downloader唯一方式。
Page
Page代表了從Downloader下載到的一個頁面——可能是HTML,也可能是JSON或者其他文本格式的內容。Page是WebMagic抽取過程的核心對象,它提供一些方法可供抽取、結果保存等。
ReusltItems
ReusltItems相當於一個Map,它保存PageProcessor處理的結果,供Pipeline使用。它的API與Map很類似,值得注意的是它有一個欄位skip,若設置為true,則不應被Pipeline處理。
2.3 控制爬蟲運轉的引擎—Spider
Spider是WebMagic內部流程的核心。Downloader、PageProcessor、Scheler、Pipeline都是Spider的一個屬性,這些屬性是可以自由設置的,通過設置這個屬性可以實現不同的功能。Spider也是WebMagic操作的入口,它封裝了爬蟲的創建、啟動、停止、多線程等功能。
對於編寫一個爬蟲,PageProcessor是需要編寫的部分,而Spider則是創建和控制爬蟲的入口。
2.4 WebMagic項目組成
WebMagic項目代碼包括幾個部分,在根目錄下以不同目錄名分開。它們都是獨立的Maven項目。
WebMagic主要包括兩個包,這兩個包經過廣泛實用,已經比較成熟:
webmagic-core
webmagic-core是WebMagic核心部分,只包含爬蟲基本模塊和基本抽取器。
webmagic-extension
webmagic-extension是WebMagic的主要擴展模塊,提供一些更方便的編寫爬蟲的工具。包括註解格式定義爬蟲、JSON、分布式等支持。
三、 基本的爬蟲
3.1 爬蟲的流程 (可以參考上邊的框架架構圖)
Downloader-頁面下載
頁面下載是一切爬蟲的開始。
大部分爬蟲都是通過模擬http請求,接收並分析響應來完成。這方面,JDK自帶的HttpURLConnection可以滿足最簡單的需要,而Apache HttpClient(4.0後整合到HttpCompenent項目中)則是開發復雜爬蟲的不二之選。它支持自定義HTTP頭(對於爬蟲比較有用的就是User-agent、cookie等)、自動redirect、連接復用、cookie保留、設置代理等諸多強大的功能。
webmagic使用了HttpClient 4.2,並封裝到了HttpClientDownloader。學習HttpClient的使用對於構建高性能爬蟲是非常有幫助的,官方的Tutorial就是很好的學習資料。目前webmagic對HttpClient的使用仍在初步階段,不過對於一般抓取任務,已經夠用了
PageProcessor-頁面分析及鏈接抽取
Selector是webmagic為了簡化頁面抽取開發的獨立模塊,是整個項目中我最得意的部分。這里整合了CSS Selector、XPath和正則表達式,並可以進行鏈式的抽取,很容易就實現強大的功能。即使你使用自己開發的爬蟲工具,webmagic的Selector仍然值得一試
Jsoup
HtmlParser
Apache tika
HtmlCleaner與Xpath
這里說的頁面分析主要指HTML頁面的分析。頁面分析可以說是垂直爬蟲最復雜的一部分,在webmagic里,PageProcessor是定製爬蟲的核心。通過編寫一個實現PageProcessor介面的類,就可以定製一個自己的爬蟲
HTML分析是一個比較復雜的工作,Java世界主要有幾款比較方便的分析工具:
webmagic的Selector
Scheler-URL管理
URL管理的問題可大可小。對於小規模的抓取,URL管理是很簡單的。我們只需要將待抓取URL和已抓取URL分開保存,並進行去重即可。使用JDK內置的集合類型Set、List或者Queue都可以滿足需要。如果我們要進行多線程抓取,則可以選擇線程安全的容器,例如LinkedBlockingQueue以及ConcurrentHashMap。因為小規模的URL管理非常簡單,很多框架都並不將其抽象為一個模塊,而是直接融入到代碼中。但是實際上,抽象出Scheler模塊,會使得框架的解耦程度上升一個檔次,並非常容易進行橫向擴展,這也是我從scrapy中學到的。
Pipeline-離線處理和持久化
Pipeline其實也是容易被忽略的一部分。大家都知道持久化的重要性,但是很多框架都選擇直接在頁面抽取的時候將持久化一起完成,例如crawer4j。但是Pipeline真正的好處是,將頁面的在線分析和離線處理拆分開來,可以在一些線程里進行下載,另一些線程里進行處理和持久化。
3.2 使用WebMagic爬取一個壁紙網站
首先引入WebMagic的依賴,webmagic-core-{version}.jar和webmagic-extension-{version}.jar。在項目中添加這兩個包的依賴,即可使用WebMagic。
maven中引入依賴jar包
不使用maven的用戶,可以去http://webmagic.io中下載最新的jar包。