Java获取网络文件并插入数据库方法是什么呢?
Java获取网络文件并插入数据库方法是什么呢?
抓取各大网站的数据插入数据库,这样就不用为没有数据而烦恼了 获取百度的歌曲名,歌手和链接!! package webTools; import java。io。BufferedReader; import java。io。IOException; import java。
io。InputStreamReader; import java。io。UnsupportedEncodingException; import java。net。MalformedURLException; import java。
net。URL; import java。util。ArrayList; import java。util。HashMap; import java。util。List; import java。util。regex。Matcher; import java。
util。regex。Pattern; import dbTools。DBTools; public class IOTOWeb { public String getHtmlContent(String htmlURL) { URL url = null; String rowContent = ""; StringBuffer htmlContent = new StringBuffer(); try { url = new URL(htmlURL); BufferedReader in = new BufferedReader(new InputStreamReader(url 。
openStream(), "gb2312")); while ((rowContent = in。readLine()) != null) { htmlContent。append(rowContent); } in。close(); } catch (MalformedURLException e) { // TODO Auto-generated catch block e。
printStackTrace(); } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block e。printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e。
printStackTrace(); } return htmlContent。toString(); } public List getLink(String htmlContent) { ArrayList listLink = new ArrayList(); String regex = "]*>[\\(]*]*href=(\"([^\"]*)\"|\'([^\']*)\'|([^\\s>]*))[^>]*>(。
*?)[\\)]*[\\s]*"; Pattern pattern = Pattern。compile(regex, Pattern。DOTALL); Matcher matcher = pattern。matcher(htmlContent); while (matcher。
find()) { listLink。add(matcher。group()); } return listLink; } public List getHref(String htmlContent) { String regex; List listtHref = new ArrayList(); regex = "href=(\"([^\"]*)\"|\'([^\']*)\'|([^\\s>]*))\""; Pattern pa = Pattern。
compile(regex, Pattern。DOTALL); Matcher ma = pa。matcher(htmlContent); while (ma。find()) { listtHref。add(ma。group()。replaceFirst("href=\"", "")。
replace("\"", "")); } return listtHref; } public List getPerson(String htmlContent) { String regex; List list = new ArrayList(); regex = "\\(]*href=(\"([^\"]*)\"|\'([^\']*)\'|([^\\s>]*))[^>]*>(。
*?)\\)"; Pattern pa = Pattern。compile(regex, Pattern。DOTALL); Matcher ma = pa。matcher(htmlContent); while (ma。find()) { list。
add(ma。group()。replaceFirst("href=\"", "")。replace("\"", "")); } return list; } public List getSongName(String htmlContent) { String regex; List listPerson = new ArrayList(); regex = "]*href=(\"([^\"]*)\"|\'([^\']*)\'|([^\\s>]*))[^>]*>(。
*?)\\s"; Pattern pa = Pattern。compile(regex, Pattern。DOTALL); Matcher ma = pa。matcher(htmlContent); while (ma。find()) { listPerson。
add(ma。group()); } return listPerson; } public String getMainContent(String htmlContent) { String regex = "(。*?)"; StringBuffer mainContent = new StringBuffer(); Pattern pattern = Pattern。
compile(regex, Pattern。DOTALL); Matcher matcher = pattern。matcher(htmlContent); while (matcher。find()) { mainContent。append(matcher。
group()); } return mainContent。toString(); } public String outTag(final String s) { return s。replaceAll("", ""); } DBTools dbTools = new DBTools(); public void getFromBaiduMap3(String htmlURL) throws Throwable { HashMap htmlContentMap = new HashMap(); String htmlContent = getHtmlContent(htmlURL); String mainContent = getMainContent(htmlContent); List listLink = getLink(mainContent); for (int j = 0; j < listLink。
size(); j++) { String tdTag = listLink。get(j)。toString(); List songNameList = getSongName(tdTag); String songName = outTag(songNameList。
get(0)。toString()); List personList = getPerson(tdTag); String songPerson = ""; if (personList。size() != 0) { for (int n = 0; n < personList。
size(); n++) { // System。out。println(personList。get(n)。toString()); songPerson = outTag(personList。get(n)。toString()); } } else { songPerson = "无"; }。
答:把sqlserver jdbc驱动加到classpath中,三个jar包。 import java.sql.*; public class DbTest { C...详情>>
问:同事ip:10.101.107.28 我的IP:10.101.104.23我们在...
答:你们公司是WINDOWS域环境吗,如果是的话,你在网上邻居里应该能看到对方的主机。让她把文件夹共享出来就可以。 如果不是WINDOWS域,那得看你们是不是在一个...详情>>
问:数据结构顺序表的建立,可定义顺序表 #define maxnum elemtyp...
答:打开VC ,然后点击新建,出来界面之后选择Win32 Console Application并输入工程的名称和选择项目的位置,然后出现“一个空工程”,在点击“...详情>>