Wenku Doc Downloader

下载文档,导出PDF或图片压缩包。支持①百度文库②豆丁网③爱问共享资料(新浪文档)④得力文库⑤道客巴巴⑥360doc个人图书馆,文档导出pdf。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。

当前为 2022-01-08 提交的版本,查看 最新版本

  1. // ==UserScript==
  2. // @name Wenku Doc Downloader
  3. // @namespace http://tampermonkey.net/
  4. // @version 1.4.4
  5. // @description 下载文档,导出PDF或图片压缩包。支持①百度文库②豆丁网③爱问共享资料(新浪文档)④得力文库⑤道客巴巴⑥360doc个人图书馆,文档导出pdf。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。
  6. // @author allenlv2690@gmail.com
  7. // @match *://*.docin.com/p-*
  8. // @match *://ishare.iask.sina.com.cn/f/*
  9. // @match *://www.deliwenku.com/p-*
  10. // @match *://www.doc88.com/p-*
  11. // @match *://www.360doc.com/content/*
  12. // @match *://wenku.baidu.com/*/*
  13. // @require https://cdn.bootcdn.net/ajax/libs/FileSaver.js/2.0.5/FileSaver.js
  14. // @require https://cdn.bootcdn.net/ajax/libs/jszip/3.6.0/jszip.js
  15. // @require https://cdn.bootcdn.net/ajax/libs/jspdf/2.3.1/jspdf.umd.min.js
  16. // @require https://cdn.bootcdn.net/ajax/libs/html2canvas/0.5.0-beta4/html2canvas.min.js
  17. // @icon https://www.google.com/s2/favicons?domain=limestart.cn
  18. // @grant none
  19. // @license GPL-3.0-only
  20. // @create 2021-11-22
  21. // ==/UserScript==
  22.  
  23. "use strict";
  24.  
  25. // 用户选项
  26. let options = {
  27. fast_mode: false,
  28. activation_test: false
  29. };
  30.  
  31. // 导入jsPDF
  32. const jsPDF = jspdf.jsPDF;
  33.  
  34. /*
  35. * 附属功能函数部分
  36. */
  37.  
  38. /**
  39. * 创建并下载文件
  40. * @param {string} fileName
  41. * @param {string} content
  42. */
  43. function createAndDownloadFile(fileName, content) {
  44. let aTag = document.createElement('a');
  45. let blob = new Blob([content]);
  46. aTag.download = fileName;
  47. aTag.href = URL.createObjectURL(blob);
  48. aTag.click();
  49. URL.revokeObjectURL(blob);
  50. }
  51.  
  52. /**
  53. * 允许打印页面
  54. */
  55. function allowPrint() {
  56. let style = document.createElement("style");
  57. style.innerHTML = `@media print {
  58. body{
  59. display:block;
  60. }
  61. }`;
  62. document.getElementsByTagName("head")[0].appendChild(style);
  63. }
  64.  
  65. /**
  66. * 强制隐藏元素
  67. * @param {String} selector
  68. */
  69. function forceHide(selector) {
  70. document.querySelectorAll(selector).forEach((elem) => {
  71. elem.className += " force_hide";
  72. });
  73. let style = document.createElement("style");
  74. style.innerHTML = `.force_hide {
  75. visibility: hidden !important;
  76. }`;
  77. document.getElementsByTagName("head")[0].appendChild(style);
  78. }
  79.  
  80. /**
  81. * 隐藏按钮,打印页面,显示按钮
  82. */
  83. function hideBtnThenPrint() {
  84. // 隐藏按钮,然后打印页面
  85. let section = document.getElementsByClassName("btns_section")[0];
  86. section.style.display = "none";
  87. window.print();
  88. // 打印结束,显示按钮
  89. section.style.removeProperty("display");
  90. }
  91.  
  92. /**
  93. * 返回times个倍数连接的str
  94. * @param {String} str
  95. * @param {Number} times
  96. * @returns multiplied_str
  97. */
  98. function multiplyStr(str, times) {
  99. let str_list = [];
  100. for (let i = 0; i < times; i++) {
  101. str_list.push(str);
  102. }
  103. return str_list.join("");
  104. }
  105.  
  106. /**
  107. * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
  108. * @param {String} custom_btn 按钮变量名
  109. */
  110. function enhanceBtnClickReaction(custom_btn = null) {
  111. let aim_btn;
  112. // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
  113. if (!custom_btn || custom_btn === "btn_1") {
  114. aim_btn = document.querySelector(".btn-1");
  115. } else {
  116. aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
  117. }
  118.  
  119. let old_color = aim_btn.style.color; // 保存旧的颜色
  120. let old_text = aim_btn.textContent; // 保存旧的文字内容
  121. // 变黑缩小
  122. aim_btn.style.color = "black";
  123. aim_btn.style.fontWeight = "normal";
  124. aim_btn.textContent = `->${old_text}<-`;
  125. // 复原加粗
  126. let changeColorBack = function() {
  127. aim_btn.style.color = old_color;
  128. aim_btn.style.fontWeight = "bold";
  129. aim_btn.textContent = old_text;
  130. };
  131. setTimeout(changeColorBack, 1250);
  132. }
  133.  
  134. /**
  135. * 切换按钮显示/隐藏状态
  136. * @param {String} aim_btn 按钮变量名
  137. * @returns 按钮元素的引用
  138. */
  139. function toggleBtnStatus(aim_btn) {
  140. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  141. let display = getComputedStyle(btn).display;
  142. // return;
  143. if (display === "none") {
  144. btn.style.display = "block";
  145. } else {
  146. btn.style.display = "none";
  147. }
  148. return btn;
  149. }
  150.  
  151. /**
  152. * 根据canvas元素数量返回quality值
  153. * @param {Number} canvas_amount
  154. * @returns quality: Number
  155. */
  156. function getQualityByCanvasAmount(canvas_amount) {
  157. let quality;
  158. if (canvas_amount <= 25) {
  159. quality = 1.0;
  160. } else if (25 < canvas_amount <= 50) {
  161. quality = 0.85;
  162. } else {
  163. quality = 0.7;
  164. }
  165. return quality;
  166. }
  167.  
  168. /**
  169. * 用input框跳转到对应页码
  170. * @param {Element} cur_page 当前页码
  171. * @param {string} aim_page 目标页码
  172. * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
  173. */
  174. function jump2pageNo(cur_page, aim_page, event_type) {
  175. // 设置跳转页码为目标页码
  176. cur_page.value = aim_page;
  177. // 模拟回车事件来跳转
  178. let keyboard_event_enter = new KeyboardEvent(event_type, {
  179. bubbles: true,
  180. cancelable: true,
  181. keyCode: 13
  182. });
  183. cur_page.dispatchEvent(keyboard_event_enter);
  184. }
  185.  
  186. /**
  187. * 滚动到页面底部
  188. */
  189. function scrollToBottom() {
  190. window.scrollTo({
  191. top: document.body.scrollHeight,
  192. behavior: "smooth"
  193. });
  194. }
  195.  
  196. /**
  197. * 用try移除元素
  198. * @param {Element} element 要移除的元素
  199. */
  200. function tryToRemoveElement(element) {
  201. try {
  202. element.remove();
  203. } catch (e) {
  204. console.log();
  205. }
  206. }
  207.  
  208. /**
  209. * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
  210. * @param {Array} elem_list_box 要移除的元素列表构成的列表
  211. */
  212. function tryToRemoveSameElem(elem_list_box) {
  213. for (let elem_list of elem_list_box) {
  214. if (!elem_list) {
  215. continue;
  216. }
  217. for (let elem of elem_list) {
  218. try {
  219. elem.remove();
  220. } catch (e) {
  221. console.log();
  222. }
  223. }
  224. }
  225. }
  226.  
  227. /**
  228. * 使文档在页面上居中
  229. * @param {String} class_name 文档元素的class
  230. * @param {String} default_offset 文档部分向右偏移的百分比(0-59)
  231. * @returns 偏移值是否合法
  232. */
  233. function centerDoc(class_name, default_offset) {
  234. let doc_main = document.getElementsByClassName(class_name)[0];
  235. let offset = window.prompt("请输入偏移百分位:", default_offset);
  236. // 如果输入的数字不在 0-59 内,提醒用户重新设置
  237. if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
  238. doc_main.style.marginLeft = offset + "%";
  239. return true;
  240. } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
  241. doc_main.style.marginLeft = offset + "%";
  242. return true
  243. } else {
  244. alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
  245. return false;
  246. }
  247. }
  248.  
  249. /**
  250. * 调整按钮内文本
  251. * @param {String} aim_btn 按钮变量名
  252. * @param {String} new_text 新的文本,null则保留旧文本
  253. * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
  254. * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
  255. */
  256. function modifyBtnText(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
  257. // 提示文档已经展开
  258. if (use_hint) {
  259. let hint = "文档已经完全展开,可以导出";
  260. alert(hint);
  261. }
  262. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  263. // 要替换的文本
  264. if (new_text) {
  265. btn.textContent = new_text;
  266. }
  267. // 推荐按钮
  268. if (recommend_btn) {
  269. btn_2.textContent += "(推荐)";
  270. }
  271. }
  272.  
  273. /*
  274. * 主要功能函数部分
  275. */
  276.  
  277. /**
  278. * 清理并打印得力文库的文档页
  279. */
  280. function printPageDeliwenku() {
  281. // 移除页面上的无关元素
  282. let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
  283. let elem_list = document.querySelectorAll(selector);
  284. for (let elem of elem_list) {
  285. tryToRemoveElement(elem);
  286. }
  287. // 修改页间距
  288. let outer_pages = document.getElementsByClassName("outer_page");
  289. for (let page of outer_pages) {
  290. page.style.marginBottom = "20px";
  291. }
  292. // 使文档居中
  293. alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
  294. if (!centerDoc("boxleft", "3")) {
  295. return; // 如果输入非法,终止函数调用
  296. }
  297. // 打印文档
  298. hideBtnThenPrint();
  299. }
  300.  
  301. /**
  302. * 清理并打印爱问共享资料的文档页
  303. * @returns 如果输入偏移量非法,返回空值以终止函数
  304. */
  305. function printPageiShare() {
  306. // # 清理并打印爱问共享资料的文档页
  307. // ## 移除页面上无关的元素
  308. // ### 移除单个元素
  309. let topbanner = document.getElementsByClassName("detail-topbanner")[0];
  310. let header = document.getElementsByClassName("new-detail-header")[0];
  311. let fixright = document.getElementById("fix-right");
  312. let redpacket = document.getElementsByClassName("loginRedPacket-dialog")[0];
  313. let fixedrightfull = document.getElementsByClassName("fixed-right-full")[0];
  314. let footer = document.getElementsByClassName("website-footer")[0];
  315. let guess = document.getElementsByClassName("guess-you-like-warpper")[0];
  316. let detailtopbox = document.getElementsByClassName("detail-top-box")[0];
  317. let fullscreen = document.getElementsByClassName("reader-fullScreen")[0];
  318. let endhint = document.getElementsByClassName("endof-trial-reading")[0];
  319. let crumb_arrow;
  320. try { crumb_arrow = document.getElementsByClassName("crumb-arrow")[0].parentElement; } catch (e) { console.log(); }
  321. let copyright = document.getElementsByClassName("copyright-container")[0];
  322. let state_btn = document.getElementsByClassName("state-bottom")[0];
  323. let comments = document.getElementsByClassName("user-comments-wrapper")[0];
  324. // ### 执行移除
  325. let elem_list = [
  326. topbanner,
  327. header,
  328. fixright,
  329. redpacket,
  330. fixedrightfull,
  331. footer,
  332. guess,
  333. detailtopbox,
  334. fullscreen,
  335. endhint,
  336. crumb_arrow,
  337. copyright,
  338. state_btn,
  339. comments
  340. ];
  341. for (let elem of elem_list) {
  342. tryToRemoveElement(elem);
  343. }
  344. // ### 移除全部同类元素
  345. let elem_list_2 = document.querySelectorAll(".tui-detail, .adv-container")
  346. for (let elem_2 of elem_list_2) {
  347. tryToRemoveElement(elem_2);
  348. }
  349. // 使文档居中
  350. alert("建议使用:\n偏移量: 18\n缩放: 默认\n如果预览中有广告,就取消打印\n再点一次按钮,预览中应该就没有广告了");
  351. if (!centerDoc("doc-main", "18")) {
  352. return; // 如果输入非法,终止函数调用
  353. }
  354. // 隐藏按钮,然后打印页面
  355. hideBtnThenPrint();
  356. }
  357.  
  358. function printPage360Doc() {
  359. // # 清理并打印360doc的文档页
  360. // ## 移除页面上无关的元素
  361. let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
  362. let elem_list = document.querySelectorAll(selector);
  363. let under_doc_1, under_doc_2;
  364. try {
  365. under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
  366. under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
  367. } catch (e) { console.log(); }
  368. // 执行移除
  369. for (let elem of elem_list) {
  370. tryToRemoveElement(elem);
  371. }
  372. tryToRemoveElement(under_doc_1);
  373. tryToRemoveElement(under_doc_2);
  374. // 执行隐藏
  375. document.querySelector("a[title]").style.display = "none";
  376.  
  377. // 使文档居中
  378. alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
  379. if (!centerDoc("a_left", "20")) {
  380. return; // 如果输入非法,终止函数调用
  381. }
  382. // 隐藏按钮,然后打印页面
  383. hideBtnThenPrint();
  384. }
  385.  
  386. function clearPage_Baidu() {
  387. let selectors = [
  388. "#hd, .aside, .reader-tools-bar-wrap, .sb-con, .bg-opacity",
  389. ".doc-tag-wrap, .doc-bottom-wrap, .ft, #ft, .crubms-wrap, .banner-ad",
  390. "#activity-tg, .top-ads-banner-wrap, .reader_ab_test, .tag-tips, .doc-value, .owner-desc-wrap"
  391. ];
  392. let elem_list = document.querySelectorAll(selectors.join(", "));
  393. for (let elem of elem_list) {
  394. tryToRemoveElement(elem);
  395. }
  396. let nut_selector = ".fix-searchbar-wrap, #hd";
  397. forceHide(nut_selector);
  398. }
  399.  
  400. /**
  401. * 绑定事件到指定按钮,返回按钮引用
  402. * @param {Function} event click事件
  403. * @param {Array} args 事件的参数列表
  404. * @param {String} aim_btn 按钮的变量名
  405. * @param {String} new_text 按钮的新文本,为null则不替换
  406. * @returns 按钮元素的引用
  407. */
  408. function setBtnEvent(event, args = [], aim_btn = "btn_3", new_text = null) {
  409. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  410. // 如果需要,替换按钮内文本
  411. if (new_text) {
  412. btn.textContent = new_text;
  413. }
  414. // 绑定事件,添加到页面上
  415. btn.onclick = () => {
  416. enhanceBtnClickReaction(aim_btn);
  417. if (args.length) {
  418. event(...args);
  419. } else {
  420. event();
  421. }
  422. };
  423. return btn;
  424. }
  425.  
  426. /**
  427. * 点击“继续阅读”,适用性:得力文库
  428. */
  429. function readAllDeliwenku() {
  430. // 点击“同意并开始预览全文”
  431. let start_btn = document.getElementsByClassName("pre_button")[0];
  432. let display = start_btn.parentElement.parentElement.style.display;
  433. // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
  434. if (!display) {
  435. start_btn.children[0].click();
  436. setTimeout("scroll(0, document.body.scrollHeight)", 200);
  437. return;
  438. }
  439. // 增强按钮点击效果
  440. enhanceBtnClickReaction();
  441.  
  442. let read_all_btn = document.getElementsByClassName("fc2e")[0];
  443. let display2 = read_all_btn.parentElement.parentElement.style.display
  444. // 继续阅读
  445. if (display2 !== "none") {
  446. // 获取input元素
  447. let cur_page = document.querySelector("#pageNumInput");
  448. let page_old = cur_page.value;
  449. let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
  450. // 跳转到尾页
  451. jump2pageNo(cur_page, page_max, "keydown");
  452. // 跳转回来
  453. jump2pageNo(cur_page, page_old, "keydown");
  454.  
  455. // 切换按钮准备导出
  456. } else {
  457. // 推荐导出全部图片链接
  458. modifyBtnText(recommend_btn = true);
  459. // 隐藏按钮
  460. toggleBtnStatus("btn_1");
  461. // 显示按钮
  462. toggleBtnStatus("btn_2");
  463. toggleBtnStatus("btn_3");
  464. // btn_3 橙色按钮
  465. setBtnEvent(printPageDeliwenku);
  466. }
  467. }
  468.  
  469. /**
  470. * 点击“展开继续阅读”,适用性:爱尚共享资料
  471. */
  472. function readAlliShare() {
  473. // 获取“继续阅读”元素
  474. let red_btn = document.getElementsByClassName("red-color")[0];
  475. let red_text = red_btn.textContent;
  476. // 如果可以展开,则展开
  477. if (red_text.search("点击可继续阅读") !== -1) {
  478. red_btn.click();
  479. setTimeout(readAlliShare, 1000);
  480. }
  481. // 否则启动按钮2,准备清理页面然后打印为PDF
  482. else {
  483. // 隐藏按钮
  484. toggleBtnStatus("btn_1");
  485. // 显示按钮
  486. toggleBtnStatus("btn_2");
  487. toggleBtnStatus("btn_3");
  488.  
  489. // 显示svg图片的链接
  490. let page1 = document.querySelector('[data-num="1"] .data-detail embed');
  491. if (!page1) {
  492. // 如果不存在svg图形,终止后续代码
  493. console.log("当前页面不存在svg图形");
  494. return;
  495. }
  496. let page2 = document.querySelector('[data-num="2"] .data-detail embed');
  497. let [svg1_src_div, svg2_src_div] = [document.createElement("div"), document.createElement("div")];
  498. svg1_src_div.innerHTML = `<div id="src-1"
  499. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  500. 访问以下链接以复制文字:<br>${page1.src}
  501. </div>`;
  502. svg2_src_div.innerHTML = `<div id="src-1"
  503. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  504. 访问以下链接以复制文字:<br>${page2.src}
  505. </div>`;
  506. // 添加到页面上
  507. page1.parentElement.parentElement.parentElement.append(svg1_src_div);
  508. page2.parentElement.parentElement.parentElement.append(svg2_src_div);
  509. }
  510. }
  511.  
  512. function readAllDoc88() {
  513. // 获取“继续阅读”按钮
  514. let continue_btn = document.querySelector("#continueButton");
  515. // 如果存在“继续阅读”按钮
  516. if (continue_btn) {
  517. // 跳转到文末(等同于展开全文)
  518. let cur_page = document.querySelector("#pageNumInput");
  519. // 取得最大页码
  520. let page_max = cur_page.parentElement.textContent.replace(" / ", "");
  521. // 跳转到尾页
  522. jump2pageNo(cur_page, page_max, "keypress");
  523. // 返回顶部
  524. setTimeout(jump2pageNo(cur_page, "1", "keypress"), 1000);
  525. }
  526. // 文档展开后,显示按钮2、3
  527. else {
  528. // 隐藏按钮
  529. toggleBtnStatus("btn_1");
  530. // 显示按钮
  531. toggleBtnStatus("btn_2");
  532. toggleBtnStatus("btn_3");
  533. }
  534. }
  535.  
  536. function readAll360Doc() {
  537. // 展开文档
  538. document.querySelector(".articleMaxH").setAttribute("class", "");
  539. // 隐藏按钮
  540. toggleBtnStatus("btn_1");
  541. // 显示按钮
  542. toggleBtnStatus("btn_2");
  543. toggleBtnStatus("btn_3");
  544. }
  545.  
  546. // function storeCanvases(selector) {
  547. // // 获取最新全部canvas
  548. // let canvas_list = document.querySelectorAll(selector);
  549. // // 获取全局canvas_map
  550. // let canvas_map = window.canvas_map;
  551.  
  552. // for (let canvas of canvas_list) {
  553. // let width, height;
  554. // width = canvas.width;
  555. // height = canvas.height;
  556.  
  557. // // 找出长宽均不为0的、可捕获的canvas
  558. // if (width && height) {
  559. // // 找出并非已有的canvas
  560. // if (!canvas_map.has(canvas.id)) {
  561. // // 捕获展开的canvas
  562. // let canvas_copy = canvas.toDataURL();
  563. // canvas_map.set(canvas.id, canvas_copy);
  564. // }
  565. // }
  566. // }
  567. // console.log(canvas_map.size);
  568.  
  569. // if (`${canvas_map.size}` === window.page_max) {
  570. // let title = document.querySelector(".doc-title").textContent;
  571. // let quality = getQualityByCanvasAmount(`${canvas_map.size}`);
  572. // // btn_3: 到pdf
  573. // setBtnEvent(saveCanvasesToPDF, [
  574. // [...canvas_map.values()], title, quality
  575. // ], "btn_3");
  576. // // btn_2: 到zip
  577. // setBtnEvent(saveCanvasesToZip, [
  578. // [...canvas_map.values()], title
  579. // ], "btn_2", "导出全部图片");
  580. // // 移除监听器
  581. // console.log("scroll监听器已经移除");
  582. // window.onscroll = () => { console.log() };
  583. // }
  584. // }
  585.  
  586. /**
  587. * 将html元素转为canvas再合并到pdf中,最后下载pdf
  588. * @param {Array} elem_list html元素列表
  589. * @param {String} title 文档标题
  590. */
  591. async function html2PDF(elem_list, title = "文档", quality) {
  592. // 如果是空元素列表,返回null并终止函数
  593. if (elem_list.length === 0) {
  594. console.log("html2PDF was called, but no canvas element avaiable.");
  595. return null;
  596. }
  597. let tasks = []; // 存放异步任务
  598. let contents = []; // 存放canvas元素
  599. for (let elem of elem_list) {
  600. let task = html2canvas(elem).then((canvas) => {
  601. contents.push(canvas);
  602. });
  603. tasks.push(task);
  604. }
  605. // 等待全部page转化完成
  606. await Promise.all(tasks);
  607. // 控制台检查结果
  608. console.log("生成的canvas元素如下:");
  609. console.log(contents);
  610.  
  611. // 拿到canvas宽、高:如果第二页存在,就用第二页的宽高,如果不存在就用第一页的
  612. let model_page = document.querySelector("#pageNo-2") ? document.querySelector("#pageNo-2") : document.querySelector("#pageNo-1");
  613. let width, height;
  614. width = model_page.offsetWidth;
  615. height = model_page.offsetHeight;
  616. // 打包为pdf
  617. saveCanvasesToPDF(contents, title, quality, width, height);
  618. }
  619.  
  620. /**
  621. * 下载全部图片链接,适用性:爱问共享资料、得力文库
  622. * @param {string} selector 图形元素的父级元素
  623. */
  624. function savePicUrls(selector) {
  625. let pages = document.querySelectorAll(selector);
  626. let pic_urls = [];
  627.  
  628. for (let elem of pages) {
  629. let pic_obj = elem.children[0];
  630. let url = pic_obj.src;
  631. pic_urls.push(url);
  632. }
  633. let content = pic_urls.join("\n");
  634. // 启动下载
  635. createAndDownloadFile("urls.csv", content);
  636. }
  637.  
  638. /**
  639. * 存储所有canvas图形为png到一个压缩包
  640. * @param {Array} node_list canvas元素列表
  641. * @param {String} title 文档标题
  642. */
  643. function saveCanvasesToZip(node_list, title) {
  644. // canvas元素转为png图像
  645. // 所有png合并为一个zip压缩包
  646. let zip = new JSZip();
  647. let n = node_list.length;
  648.  
  649. for (let i = 0; i < n; i++) {
  650. let canvas = node_list[i];
  651. let data_base64 = canvas.toDataURL();
  652. let blob = atob(data_base64.split(",")[1]);
  653. zip.file(`page-${i+1}.png`, blob, { binary: true });
  654. }
  655.  
  656. // 导出zip
  657. // promise.then(onCompleted, onRejected);
  658. zip.generateAsync({ type: "blob" }).then(function(content) {
  659. // see filesaver.js
  660. console.log(content);
  661. saveAs(content, `${title}.zip`);
  662. });
  663. }
  664.  
  665. /**
  666. * 将canvas转为jpeg,然后导出PDF
  667. * @param {Array} node_list canvas元素列表
  668. * @param {String} title 文档标题
  669. * @param {Number} quality 图片质量,浮点数,范围 (0,1],默认值0.92
  670. */
  671. function saveCanvasesToPDF(node_list, title, width = 0, height = 0) {
  672. // 如果没有手动指定canvas的长宽,则自动检测
  673. if (!width && !height) {
  674. // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
  675. let first_canvas = node_list[0];
  676. // 如果style的长宽不存在,则直接用canvas的元素长宽
  677. let width_str, height_str;
  678. if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
  679. [width_str, height_str] = [first_canvas.width, first_canvas.height];
  680. } else {
  681. [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
  682. }
  683. // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
  684. [width, height] = [parseFloat(width_str), parseFloat(height_str)];
  685. }
  686. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  687. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  688. let orientation = width > height ? 'l' : 'p';
  689. let pdf = new jsPDF(orientation, 'px', [height, width]);
  690.  
  691. // 根据canvas数量确定quality
  692. let quality = getQualityByCanvasAmount(node_list.length);
  693.  
  694. // 保存每一页文档到每一页pdf
  695. node_list.forEach(function(canvas, index) {
  696. pdf.addImage(canvas.toDataURL("image/jpeg", quality), 'JPEG', 0, 0, width, height);
  697. // 如果当前不是文档最后一页,则需要添加下一个空白页
  698. if (index !== node_list.length - 1) {
  699. pdf.addPage();
  700. }
  701. });
  702.  
  703. // 导出文件
  704. pdf.save(`${title}.pdf`);
  705. }
  706.  
  707. function saveText_360Doc() {
  708. let text_selectors = [
  709. "#artContent .blogzz_acon p",
  710. `#artContent section section span ${multiplyStr(" section", 5)} p span`,
  711. `#artContent section section span ${multiplyStr(" section", 6)}`,
  712. "#artContent span > strong",
  713. "#artContent > section > span",
  714. "#artContent > div > p > font",
  715. "#artContent > div > p > font > strong",
  716. `#artContent${multiplyStr(' section', 17)}`,
  717. "#artContent > section > section > p > span",
  718. "#artContent > div > section > span",
  719. `#artContent ${multiplyStr(' section', 4)} p`,
  720. "#artContent > section > p"
  721. ];
  722.  
  723. let paragraphs = document.querySelectorAll(text_selectors.join(", "));
  724. let images = document.querySelectorAll("#artContent img");
  725. let contents = [];
  726.  
  727. for (let i = 0; i < images.length; i++) {
  728. let src = images[i].src;
  729. contents.push(`图${i+1},链接:${src}`);
  730. }
  731. for (let p of paragraphs) {
  732. contents.push(p.textContent);
  733. }
  734. // 保存纯文本文档
  735. let title = document.querySelector("#titiletext").textContent;
  736. createAndDownloadFile(`${title}.txt`, contents.join("\n"));
  737. }
  738.  
  739. /**
  740. * 取得elem的class为class_name的父级元素
  741. * @param {String} class_name
  742. * @param {Element} elem
  743. */
  744. function getParentByClassName(class_name, elem) {
  745. let parent = elem.parentElement;
  746. let now_name;
  747. try {
  748. now_name = parent.className;
  749. } catch (e) {
  750. // 没有父级元素了,返回null
  751. return null;
  752. }
  753. let iterator_count = window.baiduJS.iterator_count;
  754. if (iterator_count > 9) {
  755. // 超过最大迭代次数,认为不存在,返回null
  756. return null;
  757. }
  758. if (now_name === class_name) {
  759. iterator_count = 0;
  760. return parent;
  761. }
  762. return getParentByClassName(class_name, parent);
  763. }
  764.  
  765. /**
  766. * 存储html元素。适用于百度文库的文字型文档
  767. */
  768. function storeHtmlElemts_Baidu() {
  769. let elems_map = window.baiduJS.elems_map;
  770. document.querySelectorAll("[class*=reader-main]").forEach(
  771. (elem) => {
  772. let origin_page_elem = getParentByClassName("bd", elem);
  773. // 复制元素防止丢失
  774. let page_elem = origin_page_elem.cloneNode(true);
  775. let id = page_elem.id;
  776. if (!elems_map.has(id)) {
  777. elems_map.set(id, page_elem);
  778. }
  779. });
  780. if (elems_map.size === window.baiduJS.max_page) {
  781. window.baiduJS.finished = true;
  782. window.onscroll = () => { console.log(); };
  783. }
  784. }
  785.  
  786. /**
  787. * 提取文字,导出txt。适用于百度文库
  788. */
  789. function saveText_Baidu() {
  790. if (!window.baiduJS.finished) {
  791. alert("1. 可能仍有内容未加载完,无法使用该功能\n建议从头到尾慢速地再浏览一遍\n2. 可能该文档是PPT等图片型文档,没有文字内容");
  792. return;
  793. }
  794. let title = document.title.split("-")[0].trim(); // 取得文档标题
  795. let page_texts = [];
  796. for (let elem of window.baiduJS.elems_map.values()) {
  797. let text = elem.textContent;
  798. page_texts.push(text);
  799. }
  800. createAndDownloadFile(`${title}.txt`, page_texts.join("\n"));
  801. }
  802.  
  803. /**
  804. * 存储html元素。适用于百度文库的PPT型文档
  805. */
  806. function storeHtmlElemts_BaiduPPT() {
  807. let elems_map = window.baiduJS.elems_map;
  808. document.querySelectorAll(".ppt-image-wrap").forEach(
  809. (elem) => {
  810. let origin_page_elem = getParentByClassName("bd", elem);
  811. // 复制元素防止丢失
  812. let page_elem = origin_page_elem.cloneNode(true);
  813. let id = page_elem.id;
  814. if (!elems_map.has(id)) {
  815. elems_map.set(id, page_elem);
  816. }
  817. });
  818. if (elems_map.size === window.baiduJS.max_page) {
  819. window.baiduJS.finished = true;
  820. window.onscroll = () => { console.log(); };
  821. }
  822. }
  823.  
  824. /**
  825. * 将文档页html转到pdf。适用于百度文库
  826. */
  827. function savePicUrls_Baidu() {
  828. let urls = [];
  829. let elems = document.querySelectorAll(".ppt-image-wrap img");
  830. if (!elems.length) {
  831. alert("当前页面没有PPT图形元素");
  832. return;
  833. }
  834. elems.forEach((elem) => {
  835. if (elem.hasAttribute("src")) {
  836. urls.push(elem.src);
  837. } else {
  838. urls.push(elem.getAttribute("data-src"));
  839. }
  840. });
  841. createAndDownloadFile("urls.csv", urls.join("\n"));
  842. }
  843.  
  844. /**
  845. * 创建4个按钮:展开文档、导出图片、导出PDF、未设定;默认均为隐藏
  846. * @returns [btn_1, btn_2]
  847. */
  848. function createBtns() {
  849. // 创建按钮组
  850. let section = document.createElement("section");
  851. section.className = "btns_section";
  852. section.innerHTML = `
  853. <p class="logo_tit">Wenku Doc Downloader</p>
  854. <button class="btn-1" title="请先滑到底部,使内容加载完,防止出现空白页">展开文档 😈</button>
  855. <button class="btn-2">导出图片 🖼️</button>
  856. <button class="btn-3">导出PDF 🌼</button>
  857. <button class="btn-4">未设定</button>`;
  858. document.body.appendChild(section);
  859.  
  860. // 设定样式
  861. let style = document.createElement("style");
  862. style.innerHTML = `
  863. .btns_section{
  864. position: fixed;
  865. width: 154px;
  866. left: 10px;
  867. top: 32%;
  868. background: #E7F1FF;
  869. border: 2px solid #1676FF;
  870. padding: 0px 0px 10px 0px;
  871. font-weight: 600;
  872. border-radius: 2px;
  873. font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
  874. 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
  875. 'Segoe UI Emoji', 'Segoe UI Symbol';
  876. z-index: 5000;
  877. }
  878. .logo_tit{
  879. width: 100%;
  880. background: #1676FF;
  881. text-align: center;
  882. font-size:12px ;
  883. color: #E7F1FF;
  884. line-height: 40px;
  885. height: 40px;
  886. margin: 0 0 16px 0;
  887. }
  888.  
  889. .btn-1{
  890. display: block;
  891. width: 128px;
  892. height: 28px;
  893. background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
  894. border-radius: 4px;
  895. color: #fff;
  896. font-size: 12px;
  897. border: none;
  898. outline: none;
  899. margin: 8px auto;
  900. font-weight: bold;
  901. cursor: pointer;
  902. opacity: .9;
  903. }
  904. .btn-2{
  905. display: none;
  906. width: 128px;
  907. height: 28px;
  908. background: #07C160;
  909. border-radius: 4px;
  910. color: #fff;
  911. font-size: 12px;
  912. border: none;
  913. outline: none;
  914. margin: 8px auto;
  915. font-weight: bold;
  916. cursor: pointer;
  917. opacity: .9;
  918. }
  919. .btn-3{
  920. display: none;
  921. width: 128px;
  922. height: 28px;
  923. background:#FA5151;
  924. border-radius: 4px;
  925. color: #fff;
  926. font-size: 12px;
  927. border: none;
  928. outline: none;
  929. margin: 8px auto;
  930. font-weight: bold;
  931. cursor: pointer;
  932. opacity: .9;
  933. }
  934. .btn-4{
  935. display: none;
  936. width: 128px;
  937. height: 28px;
  938. background: #1676FF;
  939. border-radius: 4px;
  940. color: #fff;
  941. font-size: 12px;
  942. border: none;
  943. outline: none;
  944. margin: 8px auto;
  945. font-weight: bold;
  946. cursor: pointer;
  947. opacity: .9;
  948. }
  949. .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4:hover{ opacity: .8;}
  950. .btn-1:active,.btn-2:active,.btn-3:active,.btn-4:active{ opacity: 1;}`;
  951. document.head.appendChild(style);
  952.  
  953. let btn_1, btn_2;
  954. btn_1 = document.querySelector(".btn-1");
  955. btn_2 = document.querySelector(".btn-2");
  956. // 返回元素引用
  957. return [btn_1, btn_2]
  958. }
  959.  
  960. /*
  961. * 主函数部分
  962. */
  963.  
  964. /**
  965. * 豆丁文档下载策略
  966. */
  967. function docin() {
  968. // 创建脚本启动按钮
  969. createBtns();
  970.  
  971. // 隐藏底部工具栏
  972. document.querySelector("#j_select").click(); // 选择指针
  973. let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
  974. tool_bar.style.display = "none";
  975.  
  976. // 绑定主函数
  977. let getCanvasList = function() {
  978. // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
  979. let parent_node_list = document.querySelectorAll(".hkswf-content");
  980. let node_list = [];
  981. for (let node of parent_node_list) {
  982. node_list.push(node.children[0]);
  983. }
  984. return node_list;
  985. };
  986.  
  987. let prepare = function() {
  988. // 获取canvas元素列表
  989. let node_list = getCanvasList();
  990. // 获取文档标题
  991. let title;
  992. if (document.querySelector("h1 [title=doc]")) {
  993. title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
  994. } else if (document.querySelector(".doc_title")) {
  995. title = document.querySelector(".doc_title").textContent;
  996. } else {
  997. title = "文档";
  998. }
  999. return [node_list, title];
  1000. }
  1001.  
  1002. // 判断是否有canvas元素
  1003. let detectCanvas = function() {
  1004. let haveCanvas = getCanvasList().length === 0 ? false : true;
  1005.  
  1006. // 隐藏按钮
  1007. toggleBtnStatus("btn_1");
  1008. // 显示按钮
  1009. toggleBtnStatus("btn_2");
  1010.  
  1011. // 如果没有canvas元素,则认为文档页面由外链图片构成
  1012. if (!haveCanvas) {
  1013. // btn_2: 导出图片链接
  1014. setBtnEvent(() => {
  1015. if (confirm("确定每页内容都加载完成了吗?")) {
  1016. savePicUrls("[id*=img_]");
  1017. }
  1018. }, [], "btn_2", "导出全部图片链接");
  1019. } else {
  1020. // 显示按钮3
  1021. toggleBtnStatus("btn_3");
  1022. // btn_2: 导出zip
  1023. setBtnEvent(() => {
  1024. if (confirm("确定每页内容都加载完成了吗?")) {
  1025. saveCanvasesToZip(...prepare());
  1026. }
  1027. }, [], "btn_2", "导出图片到zip");
  1028. // btn_3: 导出PDF
  1029. setBtnEvent(() => {
  1030. if (confirm("确定每页内容都加载完成了吗?")) {
  1031. saveCanvasesToPDF(...prepare());
  1032. }
  1033. }, [], "btn_3", "导出图片到PDF");
  1034. }
  1035. }
  1036. // btn_1: 判断文档类型
  1037. setBtnEvent(() => {
  1038. forceHide(".jz_watermark");
  1039. detectCanvas();
  1040. }, [], "btn_1", "判断文档类型");
  1041. }
  1042.  
  1043. /**
  1044. * 爱问共享资料文档下载策略
  1045. */
  1046. function ishare() {
  1047. // 创建脚本启动按钮1、2
  1048. createBtns();
  1049.  
  1050. // btn_1: 展开文档
  1051. setBtnEvent(readAlliShare, [], "btn_1");
  1052. // btn_2: 导出图片链接
  1053. setBtnEvent(() => {
  1054. savePicUrls(".data-detail");
  1055. }, [], "btn_2", "导出图片链接(推荐)");
  1056. // btn_3: 打印页面到PDF
  1057. setBtnEvent(printPageiShare, [], "btn_3", "打印页面到PDF");
  1058.  
  1059. // 移除底部下载条
  1060. let detailfixed = document.getElementsByClassName("detail-fixed")[0];
  1061. tryToRemoveElement(detailfixed);
  1062. }
  1063.  
  1064. /**
  1065. * 得力文库文档下载策略
  1066. */
  1067. function deliwenku() {
  1068. // 创建脚本启动按钮1、2
  1069. createBtns();
  1070.  
  1071. // btn_1: 展开文档
  1072. setBtnEvent(readAllDeliwenku, [], "btn_1");
  1073. // btn_2: 导出全部图片链接
  1074. setBtnEvent(() => {
  1075. if (confirm("确定每页内容都加载完成了吗?")) {
  1076. savePicUrls('.inner_page div');
  1077. }
  1078. }, [], "btn_2", "导出全部图片链接");
  1079.  
  1080. // 尝试关闭页面弹窗
  1081. try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
  1082. // 解除打印限制
  1083. allowPrint();
  1084. }
  1085.  
  1086. /**
  1087. * 道客巴巴文档下载策略
  1088. */
  1089. function doc88() {
  1090. // 创建脚本启动按钮1、2
  1091. createBtns();
  1092.  
  1093. // 绑定主函数
  1094. let prepare = function() {
  1095. // 获取canvas元素列表
  1096. let node_list = document.querySelectorAll(".inner_page");
  1097. // 获取文档标题
  1098. let title;
  1099. if (document.querySelector(".doctopic h1")) {
  1100. title = document.querySelector(".doctopic h1").title;
  1101. } else {
  1102. title = "文档";
  1103. }
  1104. return [node_list, title];
  1105. }
  1106.  
  1107. // btn_1: 展开文档
  1108. setBtnEvent(() => {
  1109. readAllDoc88();
  1110. }, [], "btn_1");
  1111. // btn_2: 导出zip
  1112. setBtnEvent(() => {
  1113. if (confirm("确定每页内容都加载完成了吗?")) {
  1114. saveCanvasesToZip(...prepare());
  1115. }
  1116. }, [], "btn_2", "导出图片到zip");
  1117. // btn_3: 导出PDF
  1118. setBtnEvent(() => {
  1119. if (confirm("确定每页内容都加载完成了吗?")) {
  1120. saveCanvasesToPDF(...prepare());
  1121. }
  1122. }, [], "btn_3", "导出图片到PDF");
  1123. }
  1124.  
  1125. function doc360() {
  1126. // 创建按钮区
  1127. createBtns();
  1128. // btn_1: 展开文档
  1129. setBtnEvent(readAll360Doc, [], "btn_1");
  1130. // btn_2: 导出纯文本
  1131. setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
  1132. // btn_3: 打印页面到PDF
  1133. setBtnEvent(() => {
  1134. if (confirm("确定每页内容都加载完成了吗?")) {
  1135. printPage360Doc();
  1136. }
  1137. }, [], "btn_3", "打印页面到PDF");
  1138. }
  1139. /**
  1140. * 百度文档预览策略
  1141. */
  1142. function baiduWenku() {
  1143. // 原文档解析到预览文档
  1144. if (location.href.includes("\u002f\u0076\u0069\u0065\u0077\u002f")) {
  1145. createBtns();
  1146. let jump2sharePage_Baidu = function() {
  1147. location.href = `https://${location.host}${location.pathname.replace("\u0076\u0069\u0065\u0077", "\u0073\u0068\u0061\u0072\u0065")}`;
  1148. }
  1149. setBtnEvent(jump2sharePage_Baidu, [], "btn_1");
  1150. // 预览文档清理广告
  1151. } else if (location.href.includes("\u002f\u0073\u0068\u0061\u0072\u0065\u002f")) {
  1152. createBtns();
  1153. // 隐藏按钮
  1154. toggleBtnStatus("btn_1");
  1155. // 显示按钮
  1156. toggleBtnStatus("btn_2");
  1157. toggleBtnStatus("btn_3");
  1158. toggleBtnStatus("btn_4");
  1159. // 清理无关页面元素并打印页面
  1160. let printPage = function() {
  1161. let read_more_btn = document.querySelector("#html-reader-go-more");
  1162. let unfold_all;
  1163.  
  1164. if (read_more_btn) {
  1165. unfold_all = read_more_btn.style.display === "none";
  1166. } else {
  1167. unfold_all = !Boolean(document.querySelector("[id*=next-pageList]"));
  1168. }
  1169. if (unfold_all) {
  1170. if (confirm("文档都加载完毕了吗?")) {
  1171. let sentence_1 = "\u5982\u679c\u51fa\u73b0\u5927\u7247\u7a7a\u767d\u9875\uff0c\u8bf4\u660e";
  1172. let sentence_2 = "\u6587\u6863\u6709\u4fdd\u62a4\u673a\u5236\uff0c\u65e0\u6cd5\u6253\u5370";
  1173. alert(`${sentence_1}${sentence_2}`);
  1174. allowPrint();
  1175. clearPage_Baidu();
  1176. hideBtnThenPrint();
  1177. }
  1178. } else {
  1179. alert("文档尚未完全展开,无法使用该功能。");
  1180. }
  1181. }
  1182. let max_page = parseInt(document.querySelector(".page-count").textContent.replace("/", ""));
  1183. // 为动态收集文档页元素提供全局变量
  1184. window.baiduJS = {
  1185. max_page: max_page,
  1186. elems_map: new Map(), // id: element
  1187. iterator_count: 0, // getParentByClassName的最大迭代次数为9
  1188. finished: false // 是否收集完了全部文档页元素
  1189. };
  1190. // 跟随浏览,动态收集页面元素
  1191. window.onscroll = storeHtmlElemts_Baidu;
  1192. // 绑定事件到按钮
  1193. setBtnEvent(printPage, [], "btn_2", "\u6253\u5370\u9875\u9762\u5230\u0050\u0044\u0046");
  1194. setBtnEvent(saveText_Baidu, [], "btn_3", "\u5bfc\u51fa\u7eaf\u6587\u672c");
  1195. setBtnEvent(savePicUrls_Baidu, [], "btn_4", "导出图片链接(仅PPT)");
  1196. } else {
  1197. console.log(`无法识别的页面:${location.href}`);
  1198. }
  1199. }
  1200.  
  1201. /**
  1202. * 主函数:识别网站,执行对应文档下载策略
  1203. */
  1204. function main() {
  1205. let host = window.location.host;
  1206. console.log(`当前host: ${host}`);
  1207.  
  1208. if (host.includes("docin.com")) {
  1209. docin();
  1210. } else if (host === "ishare.iask.sina.com.cn") {
  1211. ishare();
  1212. } else if (host === "www.deliwenku.com") {
  1213. deliwenku();
  1214. } else if (host === "www.doc88.com") {
  1215. doc88();
  1216. } else if (host === "www.360doc.com") {
  1217. doc360();
  1218. } else if (host === "wenku.baidu.com") {
  1219. baiduWenku();
  1220. } else {
  1221. console.log("匹配到了无效网页");
  1222. }
  1223. }
  1224.  
  1225. if (options.activation_test) {
  1226. alert(`Wenku Doc Downloader 已经在当前页面生效!\n当前站点为:\n${window.location.host}`);
  1227. }
  1228.  
  1229. if (options.fast_mode) {
  1230. main();
  1231. } else {
  1232. window.onload = main;
  1233. }
  1234.  
  1235.  
  1236. // let url_tasks = [];
  1237. // let contents = [];
  1238. // for (let url of urls) {
  1239. // let task = fetch(url).then(response => response.blob()).then(blob => contents.push(blob));
  1240. // url_tasks.push(task);
  1241. // }
  1242. // await Promise.all(url_tasks);

QingJ © 2025

镜像随时可能失效,请加Q群300939539或关注我们的公众号极客氢云获取最新地址