Wenku Doc Downloader

下载文档,导出PDF。支持 ①百度文库 ②豆丁网 ③道客巴巴 ④360doc个人图书馆 ⑤得力文库 ⑥MBA智库 ⑦爱问共享资料(新浪文档) ⑧原创力文档 ⑨读根网。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。

当前为 2022-03-25 提交的版本,查看 最新版本

  1. // ==UserScript==
  2. // @name Wenku Doc Downloader
  3. // @namespace http://tampermonkey.net/
  4. // @version 1.5.5
  5. // @description 下载文档,导出PDF。支持 ①百度文库 ②豆丁网 ③道客巴巴 ④360doc个人图书馆 ⑤得力文库 ⑥MBA智库 ⑦爱问共享资料(新浪文档) ⑧原创力文档 ⑨读根网。在文档页面左侧中间有Wenku Doc Download按钮区,说明脚本生效了。【反馈请提供网址】。不支持手机端。你能预览多少页,就可以导出多少页的PDF。
  6. // @author allenlv2690@gmail.com
  7. // @match *://*.docin.com/p-*
  8. // @match *://ishare.iask.sina.com.cn/f/*
  9. // @match *://www.deliwenku.com/p-*
  10. // @match *://www.doc88.com/p-*
  11. // @match *://www.360doc.com/content/*
  12. // @match *://wenku.baidu.com/*/*
  13. // @match *://doc.mbalib.com/view/*
  14. // @match *://www.woc88.com/so-*
  15. // @match *://www.dugen.com/p-*
  16. // @match *://max.book118.com/html/*
  17. // @match *://view-cache.book118.com/pptView.html?*
  18. // @match *://*.book118.com/?readpage=*
  19. // @require https://cdn.staticfile.org/FileSaver.js/2.0.5/FileSaver.min.js
  20. // @require https://cdn.staticfile.org/jszip/3.7.1/jszip.min.js
  21. // @require https://cdn.staticfile.org/jspdf/2.5.1/jspdf.umd.min.js
  22. // @require https://cdn.staticfile.org/html2canvas/1.4.1/html2canvas.min.js
  23. // @icon https://s2.loli.net/2022/01/12/wc9je8RX7HELbYQ.png
  24. // @icon64 https://s2.loli.net/2022/01/12/tmFeSKDf8UkNMjC.png
  25. // @grant none
  26. // @license GPL-3.0-only
  27. // @create 2021-11-22
  28. // @note 1. 完善了“问题说明”
  29. // @note 2. 发现了与【🔥🔥🔥文本选中复制🔥🔥🔥】的冲突
  30. // ==/UserScript==
  31.  
  32.  
  33. (function () {
  34. 'use strict';
  35.  
  36. let utils = {
  37. ver: (() => {
  38. // 显示版本号
  39. let _ver = "wk-utils: ver-1.5.5";
  40. console.log(_ver);
  41. return _ver;
  42. })(),
  43.  
  44. /**
  45. * 创建并下载文件
  46. * @param {String} file_name 文件名
  47. * @param {String | Blob} content 文本或blob
  48. */
  49. createAndDownloadFile: function(file_name, content) {
  50. let aTag = document.createElement('a');
  51. let blob;
  52. if (typeof(content) === "string") {
  53. blob = new Blob([content]);
  54. }
  55. aTag.download = file_name;
  56. aTag.href = URL.createObjectURL(blob);
  57. aTag.click();
  58. URL.revokeObjectURL(blob);
  59. },
  60.  
  61. /**
  62. * 创建并下载链接资源
  63. * @param {String} file_name
  64. * @param {String} src
  65. */
  66. downloadUrlFile: function(file_name, src) {
  67. let aTag = document.createElement('a');
  68. aTag.download = file_name;
  69. aTag.href = src;
  70. aTag.click();
  71. },
  72.  
  73. /**
  74. * 添加外部js到当前页面
  75. * @param {String} url
  76. */
  77. addScripts2HTML: function(url) {
  78. let script = document.createElement("script");
  79. script.src = url;
  80. document.head.appendChild(script);
  81. },
  82.  
  83. /**
  84. * 临时禁用脚本,执行func后移除btns_section。
  85. * @param {Function} func
  86. */
  87. banSelf: function(func = () => { }) {
  88. func();
  89. document.querySelector(".btns_section").remove();
  90. },
  91.  
  92. /**
  93. * 睡眠 delay 毫秒
  94. * @param {Number} delay
  95. */
  96. sleep: function(delay) {
  97. let start = (new Date()).getTime();
  98. while ((new Date()).getTime() - start < delay) {
  99. continue;
  100. }
  101. },
  102.  
  103. /**
  104. * 允许打印页面
  105. */
  106. allowPrint: function() {
  107. let style = document.createElement("style");
  108. style.innerHTML = `
  109. @media print {
  110. body{
  111. display:block;
  112. }
  113. }
  114. `;
  115. document.head.appendChild(style);
  116. },
  117.  
  118. /**
  119. * 在指定节点后面插入节点
  120. * @param {Element} new_element
  121. * @param {Element} target_element
  122. */
  123. insertAfter: function(new_element, target_element) {
  124. let parent = target_element.parentNode;
  125. if (parent.lastChild === target_element) {
  126. parent.appendChild(new_element);
  127. } else {
  128. parent.insertBefore(new_element, target_element.nextElementSibling);
  129. }
  130. },
  131.  
  132. /**
  133. * 求main_set去除cut_set后的set
  134. * @param {Set} main_set
  135. * @param {Set} cut_set
  136. * @returns 差集
  137. */
  138. difference: function(main_set, cut_set) {
  139. let _diff = new Set(main_set);
  140. for (let elem of cut_set) {
  141. _diff.delete(elem);
  142. }
  143. return _diff;
  144. },
  145.  
  146. /**
  147. * 抛出set中的第一个元素
  148. * @param {Set} set
  149. * @returns 一个元素
  150. */
  151. setPop: function(set) {
  152. for (let item of set) {
  153. set.delete(item);
  154. return item;
  155. }
  156. },
  157.  
  158. /**
  159. * 绑定事件到指定按钮,返回按钮引用
  160. * @param {Function} event click事件
  161. * @param {Array} args 事件的参数列表
  162. * @param {String} aim_btn 按钮的变量名
  163. * @param {String} new_text 按钮的新文本,为null则不替换
  164. * @returns 按钮元素的引用
  165. */
  166. setBtnEvent: function(event, args = [], aim_btn = "btn_3", new_text = null) {
  167. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  168. // 如果需要,替换按钮内文本
  169. if (new_text) {
  170. btn.textContent = new_text;
  171. }
  172. // 绑定事件,添加到页面上
  173. btn.onclick = () => {
  174. this.enhanceBtnClickReaction(aim_btn);
  175. if (args.length) {
  176. event(...args);
  177. } else {
  178. event();
  179. }
  180. };
  181. return btn;
  182. },
  183.  
  184. /**
  185. * 强制隐藏元素
  186. * @param {String} selector
  187. */
  188. forceHide: function(selector) {
  189. let style_cls = "force-hide";
  190. document.querySelectorAll(selector).forEach((elem) => {
  191. elem.className += ` ${style_cls}`;
  192. });
  193. // 判断css样式是否已经存在
  194. let style;
  195. style = document.querySelector(`style.${style_cls}`);
  196. // 如果已经存在,则无须重复创建
  197. if (style) {
  198. return;
  199. }
  200. // 否则创建
  201. style = document.createElement("style");
  202. style.innerHTML = `style.${style_cls} {
  203. visibility: hidden !important;
  204. }`;
  205. document.head.appendChild(style);
  206. },
  207.  
  208. /**
  209. * 隐藏按钮,打印页面,显示按钮
  210. */
  211. hideBtnThenPrint: function() {
  212. // 隐藏按钮,然后打印页面
  213. let section = document.getElementsByClassName("btns_section")[0];
  214. section.style.display = "none";
  215. window.print();
  216. // 打印结束,显示按钮
  217. section.style.removeProperty("display");
  218. },
  219.  
  220. /**
  221. * 返回times个倍数连接的str
  222. * @param {String} str
  223. * @param {Number} times
  224. * @returns multiplied_str
  225. */
  226. multiplyStr: function(str, times) {
  227. let str_list = [];
  228. for (let i = 0; i < times; i++) {
  229. str_list.push(str);
  230. }
  231. return str_list.join("");
  232. },
  233.  
  234. /**
  235. * 增强按钮(默认为蓝色按钮:展开文档)的点击效果
  236. * @param {String} custom_btn 按钮变量名
  237. */
  238. enhanceBtnClickReaction: function(custom_btn = null) {
  239. let aim_btn;
  240. // 如果不使用自定义按钮元素,则默认为使用蓝色展开文档按钮
  241. if (!custom_btn || custom_btn === "btn_1") {
  242. aim_btn = document.querySelector(".btn-1");
  243. } else {
  244. aim_btn = document.querySelector(`.${custom_btn.replace("_", "-")}`);
  245. }
  246.  
  247. let old_color = aim_btn.style.color; // 保存旧的颜色
  248. let old_text = aim_btn.textContent; // 保存旧的文字内容
  249. // 变黑缩小
  250. aim_btn.style.color = "black";
  251. aim_btn.style.fontWeight = "normal";
  252. aim_btn.textContent = `->${old_text}<-`;
  253. // 复原加粗
  254. let changeColorBack = function() {
  255. aim_btn.style.color = old_color;
  256. aim_btn.style.fontWeight = "bold";
  257. aim_btn.textContent = old_text;
  258. };
  259. setTimeout(changeColorBack, 1250);
  260. },
  261.  
  262. /**
  263. * 切换按钮显示/隐藏状态
  264. * @param {String} aim_btn 按钮变量名
  265. * @returns 按钮元素的引用
  266. */
  267. toggleBtnStatus: function(aim_btn) {
  268. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  269. let display = getComputedStyle(btn).display;
  270. // return;
  271. if (display === "none") {
  272. btn.style.display = "block";
  273. } else {
  274. btn.style.display = "none";
  275. }
  276. return btn;
  277. },
  278.  
  279. /**
  280. * 根据canvas元素数量返回quality值
  281. * @param {Number} canvas_amount
  282. * @returns quality: Number
  283. */
  284. getQualityByCanvasAmount: function(canvas_amount) {
  285. // 如果有全局参数,优先用全局的
  286. if (window.img_quality !== undefined) {
  287. console.log(`image quality: ${window.img_quality*100}%`);
  288. return window.img_quality;
  289. }
  290. // 否则用默认的
  291. let quality;
  292. if (canvas_amount <= 25) {
  293. quality = 1.0;
  294. } else if (25 < canvas_amount <= 50) {
  295. quality = 0.9;
  296. } else {
  297. quality = 0.8;
  298. }
  299. console.log(`image quality: ${quality*100}%`);
  300. return quality;
  301. },
  302.  
  303. /**
  304. * 挂载func到全局
  305. * @param {Function} func
  306. */
  307. globalFunc: function(func) {
  308. globalThis[func.name] = func;
  309. },
  310.  
  311. /**
  312. * 用input框跳转到对应页码
  313. * @param {Element} cur_page 当前页码
  314. * @param {string} aim_page 目标页码
  315. * @param {string} event_type 键盘事件类型:"keyup" | "keypress" | "keydown"
  316. */
  317. jump2pageNo: function(cur_page, aim_page, event_type) {
  318. // 设置跳转页码为目标页码
  319. cur_page.value = aim_page;
  320. // 模拟回车事件来跳转
  321. let keyboard_event_enter = new KeyboardEvent(event_type, {
  322. bubbles: true,
  323. cancelable: true,
  324. keyCode: 13
  325. });
  326. cur_page.dispatchEvent(keyboard_event_enter);
  327. },
  328.  
  329. /**
  330. * 在新标签页打开链接
  331. * @param {String} href
  332. */
  333. openInNewTab: function(href) {
  334. let link = document.createElement("a");
  335. link.href = href;
  336. link.target = "_blank";
  337. link.click();
  338. },
  339.  
  340. /**
  341. * 滚动到页面底部
  342. */
  343. scrollToBottom: function() {
  344. window.scrollTo({
  345. top: document.body.scrollHeight,
  346. behavior: "smooth"
  347. });
  348. },
  349.  
  350. /**
  351. * 用try移除元素
  352. * @param {Element} element 要移除的元素
  353. */
  354. tryToRemoveElement: function(element) {
  355. try {
  356. element.remove();
  357. } catch (e) {
  358. }
  359. },
  360.  
  361. /**
  362. * 用try移除 [元素列表1, 元素列表2, ...] 中的元素
  363. * @param {Array} elem_list_box 要移除的元素列表构成的列表
  364. */
  365. tryToRemoveSameElem: function(elem_list_box) {
  366. for (let elem_list of elem_list_box) {
  367. if (!elem_list) {
  368. continue;
  369. }
  370. for (let elem of elem_list) {
  371. try {
  372. elem.remove();
  373. } catch (e) {
  374. console.log();
  375. }
  376. }
  377. }
  378. },
  379.  
  380. /**
  381. * 使文档在页面上居中
  382. * @param {String} selector 文档容器的css选择器
  383. * @param {String} default_offset 文档部分向右偏移的百分比(0-59)
  384. * @returns 偏移值是否合法
  385. */
  386. centerDoc: function(selector, default_offset) {
  387. let doc_main = document.querySelector(selector);
  388. let offset = window.prompt("请输入偏移百分位:", default_offset);
  389. // 如果输入的数字不在 0-59 内,提醒用户重新设置
  390. if (offset.length === 1 && offset.search(/[0-9]/) !== -1) {
  391. doc_main.style.marginLeft = offset + "%";
  392. return true;
  393. } else if (offset.length === 2 && offset.search(/[1-5][0-9]/) !== -1) {
  394. doc_main.style.marginLeft = offset + "%";
  395. return true
  396. } else {
  397. alert("请输入一个正整数,范围在0至59之间,用来使文档居中\n(不同文档偏移量不同,所以需要手动调整)");
  398. return false;
  399. }
  400. },
  401.  
  402. /**
  403. * 调整按钮内文本
  404. * @param {String} aim_btn 按钮变量名
  405. * @param {String} new_text 新的文本,null则保留旧文本
  406. * @param {Boolean} recommend_btn 是否增加"(推荐)"到按钮文本
  407. * @param {Boolean} use_hint 是否提示"文档已经完全展开,可以导出"
  408. */
  409. modifyBtnText: function(aim_btn = "btn_2", new_text = null, recommend_btn = false, use_hint = true) {
  410. // 提示文档已经展开
  411. if (use_hint) {
  412. let hint = "文档已经完全展开,可以导出";
  413. alert(hint);
  414. }
  415. let btn = document.querySelector(`.${aim_btn.replace("_", "-")}`);
  416. // 要替换的文本
  417. if (new_text) {
  418. btn.textContent = new_text;
  419. }
  420. // 推荐按钮
  421. if (recommend_btn) {
  422. btn.textContent += "(推荐)";
  423. }
  424. },
  425.  
  426. html2Canvases: async function(elem_list) {
  427. // 如果是空元素列表,返回null并终止函数
  428. if (elem_list.length === 0) {
  429. console.log("html2canvases was called, but no element is avaiable.");
  430. return null;
  431. }
  432. let tasks = []; // 存放异步任务
  433. let contents = []; // 存放canvas元素
  434. for (let elem of elem_list) {
  435. let task = html2canvas(elem).then((canvas) => {
  436. contents.push(canvas);
  437. });
  438. tasks.push(task);
  439. }
  440. // 等待全部page转化完成
  441. await Promise.all(tasks);
  442. return contents;
  443. },
  444.  
  445. /**
  446. * 将html元素转为canvas再合并到pdf中,最后下载pdf
  447. * @param {Array} elem_list html元素列表
  448. * @param {String} title 文档标题
  449. */
  450. html2PDF: async function(elem_list, title = "文档") {
  451. // 如果是空元素列表,终止函数
  452. let _contents = this.html2Canvases(elem_list);
  453. if (_contents === null) {
  454. return;
  455. }
  456. _contents.then((contents) => {
  457. // 控制台检查结果
  458. console.log("生成的canvas元素如下:");
  459. console.log(contents);
  460.  
  461. // 拿到canvas宽、高
  462. let model = elem_list[0];
  463. let width, height;
  464. width = model.offsetWidth;
  465. height = model.offsetHeight;
  466. // 打包为pdf
  467. this.saveCanvasesToPDF(contents, title, width, height);
  468. });
  469. },
  470.  
  471. /**
  472. * 下载全部图片链接,适用性:爱问共享资料、得力文库
  473. * @param {string} selector 图形元素的父级元素
  474. */
  475. savePicUrls: function(selector) {
  476. let pages = document.querySelectorAll(selector);
  477. let pic_urls = [];
  478.  
  479. for (let elem of pages) {
  480. let pic_obj = elem.children[0];
  481. let url = pic_obj.src;
  482. pic_urls.push(url);
  483. }
  484. let content = pic_urls.join("\n");
  485. // 启动下载
  486. this.createAndDownloadFile("urls.csv", content);
  487. },
  488.  
  489. /**
  490. * 存储所有canvas图形为png到一个压缩包
  491. * @param {Array} node_list canvas元素列表
  492. * @param {String} title 文档标题
  493. */
  494. saveCanvasesToZip: function(node_list, title) {
  495. // canvas元素转为png图像
  496. // 所有png合并为一个zip压缩包
  497. let zip = new JSZip();
  498. let n = node_list.length;
  499.  
  500. for (let i = 0; i < n; i++) {
  501. let canvas = node_list[i];
  502. let data_base64 = canvas.toDataURL();
  503. let blob = atob(data_base64.split(",")[1]);
  504. zip.file(`page-${i+1}.png`, blob, { binary: true });
  505. }
  506.  
  507. // 导出zip
  508. // promise.then(onCompleted, onRejected);
  509. zip.generateAsync({ type: "blob" }).then(function(content) {
  510. // see filesaver.js
  511. console.log(content);
  512. saveAs(content, `${title}.zip`);
  513. });
  514. },
  515.  
  516. /**
  517. * 将canvas转为jpeg,然后导出PDF
  518. * @param {Array} node_list canvas元素列表
  519. * @param {String} title 文档标题
  520. */
  521. saveCanvasesToPDF: function(node_list, title, width = 0, height = 0) {
  522. // 如果没有手动指定canvas的长宽,则自动检测
  523. if (!width && !height) {
  524. // 先获取第一个canvas用于判断竖向还是横向,以及得到页面长宽
  525. let first_canvas = node_list[0];
  526. // 如果style的长宽不存在,则直接用canvas的元素长宽
  527. let width_str, height_str;
  528. if (first_canvas.width && parseInt(first_canvas.width) && parseInt(first_canvas.height)) {
  529. [width_str, height_str] = [first_canvas.width, first_canvas.height];
  530. } else {
  531. [width_str, height_str] = [first_canvas.style.width.replace(/(px)|(rem)|(em)/, ""), first_canvas.style.height.replace(/(px)|(rem)|(em)/, "")];
  532. }
  533. // jsPDF的第三个参数为format,当自定义时,参数为数字数组。
  534. [width, height] = [parseFloat(width_str), parseFloat(height_str)];
  535. }
  536. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  537. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  538. let orientation = width > height ? 'l' : 'p';
  539. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  540.  
  541. // 根据canvas数量确定quality
  542. let quality = this.getQualityByCanvasAmount(node_list.length);
  543.  
  544. // 保存每一页文档到每一页pdf
  545. node_list.forEach(function(canvas, index) {
  546. pdf.addImage(canvas.toDataURL("image/jpeg", quality), 'JPEG', 0, 0, width, height);
  547. // 如果当前不是文档最后一页,则需要添加下一个空白页
  548. if (index !== node_list.length - 1) {
  549. pdf.addPage();
  550. }
  551. });
  552.  
  553. // 导出文件
  554. pdf.save(`${title}.pdf`);
  555. },
  556.  
  557. /**
  558. * Image元素列表合并到一个PDF中
  559. * @param {NodeList} imgs Image元素列表
  560. * @param {String} title 文档名
  561. */
  562. imgs2pdf: function(imgs, title) {
  563. // 取得宽高
  564. let model = imgs[0];
  565. let width = model.offsetWidth;
  566. let height = model.offsetHeight;
  567.  
  568. // 创建pdf
  569. let orientation = width > height ? 'l' : 'p';
  570. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  571.  
  572. // 添加图像到pdf
  573. imgs.forEach((img, index) => {
  574. pdf.addImage(img, 'PNG', 0, 0, width, height);
  575. // 如果当前不是文档最后一页,则需要添加下一个空白页
  576. if (index !== imgs.length - 1) {
  577. pdf.addPage();
  578. }
  579. });
  580.  
  581. // 导出文件
  582. pdf.save(`${title}.pdf`);
  583. },
  584.  
  585. /**
  586. * 取得elem的class为class_name的父级元素
  587. * @param {String} class_name
  588. * @param {Element} elem 起点元素
  589. * @param {object} JSobj 全局对象,需要有<iterator_count>计数器。默认为window.baiduJS。
  590. * @param {Boolean} ignore 是否忽略递归计数器。默认false。如果启用请确保不会无限递归。
  591. * @returns {null | Element} parent_element
  592. */
  593. getParentByClassName: function(class_name, elem, JSobj, ignore = false) {
  594. let parent = elem.parentElement;
  595. let iterator_count = JSobj.iterator_count;
  596. let now_name;
  597.  
  598. try {
  599. now_name = parent.className;
  600. } catch (e) {
  601. JSobj.iterator_count = 0;
  602. // 没有父级元素了
  603. return "no parent node";
  604. }
  605.  
  606. // 如果不忽略递归次数计数器
  607. if (!ignore) {
  608. if (iterator_count > 9) {
  609. // 超过最大迭代次数,认为不存在,返回null
  610. JSobj.iterator_count = 0;
  611. return "over max iterator counts limit";
  612. } else {
  613. JSobj.iterator_count += 1;
  614. }
  615. }
  616. // 如果类名匹配,返回该节点
  617. if (now_name.split(" ").includes(class_name)) {
  618. iterator_count = 0;
  619. return parent;
  620. }
  621. return this.getParentByClassName(class_name, parent, JSobj);
  622. },
  623.  
  624. /**
  625. * 将func绑定到window.onscroll,并设置触发频率
  626. * @param {Function} func scroll的监听函数
  627. * @param {Object} JSobj 全局对象,至少要有srcoll_count
  628. * @param {Number} useful_range 有效的触发范围,默认是10。即0-10次时触发函数。
  629. * @param {Number} wait_range 等待的范围,默认是110。即useful_range-110次不触发函数。
  630. * @param {String} hint 触发函数后的日志内容,默认为空字符串。
  631. * @param {Window} inner_window 特定的window对象,主要用于 iframe 情况。JSobj中必须有scrollFunc,在调用后会重新写入scrollFunc。
  632. */
  633. scrollFunc: function(func, JSobj, useful_range = 10, wait_range = 110, hint = "", inner_window = null) {
  634. if (JSobj.scroll_count === undefined) {
  635. alert(`${JSobj}的 scroll_count 属性不存在!检查单词拼写!`);
  636. return;
  637. }
  638.  
  639. let new_func = (func, JSobj, useful_range, wait_range, hint) => {
  640. JSobj.scroll_count += 1;
  641. if (JSobj.scroll_count < useful_range) {
  642. func();
  643. console.log(hint);
  644. } else if (JSobj.scroll_count > wait_range) {
  645. JSobj.scroll_count = 0;
  646. }
  647. };
  648. // 如果没有指定的window对象,则使用默认的window
  649. if (!inner_window) {
  650. window.onscroll = () => {
  651. new_func(func, JSobj, useful_range, wait_range, hint);
  652. };
  653. return;
  654. }
  655. // 特定的window对象,一般用于iframe,追加scroll监听器
  656. let scrollFunc = () => {
  657. new_func(func, JSobj, useful_range, wait_range, hint);
  658. };
  659. JSobj.scrollFunc = scrollFunc;
  660. inner_window.addEventListener("scroll", scrollFunc, false);
  661. },
  662.  
  663. /**
  664. * 创建5个按钮:展开文档、导出图片、导出PDF、未设定4、未设定5;默认均为隐藏
  665. */
  666. createBtns: function() {
  667. // 创建按钮组
  668. let section = document.createElement("section");
  669. section.className = "btns_section";
  670. section.innerHTML = `
  671. <p class="logo_tit">Wenku Doc Downloader</p>
  672. <button class="btn-1" title="请先使内容加载完,防止出现空白页">展开文档 😈</button>
  673. <button class="btn-2">未设定2</button>
  674. <button class="btn-3">未设定3</button>
  675. <button class="btn-4">未设定4</button>
  676. <button class="btn-5">未设定5</button>`;
  677. document.body.appendChild(section);
  678.  
  679. // 设定样式
  680. let style = document.createElement("style");
  681. style.innerHTML = `
  682. .btns_section{
  683. position: fixed;
  684. width: 154px;
  685. left: 10px;
  686. top: 32%;
  687. background: #E7F1FF;
  688. border: 2px solid #1676FF;
  689. padding: 0px 0px 10px 0px;
  690. font-weight: 600;
  691. border-radius: 2px;
  692. font-family: -apple-system, BlinkMacSystemFont, 'Segoe UI', 'PingFang SC', 'Hiragino Sans GB',
  693. 'Microsoft YaHei', 'Helvetica Neue', Helvetica, Arial, sans-serif, 'Apple Color Emoji',
  694. 'Segoe UI Emoji', 'Segoe UI Symbol';
  695. z-index: 5000;
  696. }
  697. .logo_tit{
  698. width: 100%;
  699. background: #1676FF;
  700. text-align: center;
  701. font-size:12px ;
  702. color: #E7F1FF;
  703. line-height: 40px;
  704. height: 40px;
  705. margin: 0 0 16px 0;
  706. }
  707.  
  708. .btn-1{
  709. display: block;
  710. width: 128px;
  711. height: 28px;
  712. background: linear-gradient(180deg, #00E7F7 0%, #FEB800 0.01%, #FF8700 100%);
  713. border-radius: 4px;
  714. color: #fff;
  715. font-size: 12px;
  716. border: none;
  717. outline: none;
  718. margin: 8px auto;
  719. font-weight: bold;
  720. cursor: pointer;
  721. opacity: .9;
  722. }
  723. .btn-2{
  724. display: none;
  725. width: 128px;
  726. height: 28px;
  727. background: #07C160;
  728. border-radius: 4px;
  729. color: #fff;
  730. font-size: 12px;
  731. border: none;
  732. outline: none;
  733. margin: 8px auto;
  734. font-weight: bold;
  735. cursor: pointer;
  736. opacity: .9;
  737. }
  738. .btn-3{
  739. display: none;
  740. width: 128px;
  741. height: 28px;
  742. background:#FA5151;
  743. border-radius: 4px;
  744. color: #fff;
  745. font-size: 12px;
  746. border: none;
  747. outline: none;
  748. margin: 8px auto;
  749. font-weight: bold;
  750. cursor: pointer;
  751. opacity: .9;
  752. }
  753. .btn-4{
  754. display: none;
  755. width: 128px;
  756. height: 28px;
  757. background: #1676FF;
  758. border-radius: 4px;
  759. color: #fff;
  760. font-size: 12px;
  761. border: none;
  762. outline: none;
  763. margin: 8px auto;
  764. font-weight: bold;
  765. cursor: pointer;
  766. opacity: .9;
  767. }
  768. .btn-5{
  769. display: none;
  770. width: 128px;
  771. height: 28px;
  772. background: #ff6600;
  773. border-radius: 4px;
  774. color: #fff;
  775. font-size: 12px;
  776. border: none;
  777. outline: none;
  778. margin: 8px auto;
  779. font-weight: bold;
  780. cursor: pointer;
  781. opacity: .9;
  782. }
  783. .btn-1:hover,.btn-2:hover,.btn-3:hover,.btn-4,.btn-5:hover{ opacity: .8;}
  784. .btn-1:active,.btn-2:active,.btn-3:active,.btn-4,.btn-5:active{ opacity: 1;}`;
  785. document.head.appendChild(style);
  786. }
  787. };
  788.  
  789. /**
  790. * 清理百度文库页面的无关元素
  791. */
  792. function clearPage_Baidu() {
  793. let selectors = [
  794. "#hd, .aside, .reader-tools-bar-wrap, .sb-con, .bg-opacity",
  795. ".doc-tag-wrap, .doc-bottom-wrap, .ft, #ft, .crubms-wrap, .banner-ad",
  796. "#activity-tg, .top-ads-banner-wrap, .reader_ab_test, .tag-tips, .doc-value",
  797. ".owner-desc-wrap, a[title='全屏显示'], #next_doc_box, .fix-searchbar-wrap",
  798. ".hx-warp, .lazy-load, .no-full-screen, [class*=vip-pay-pop], .bottom-edge, .info",
  799. ".hx-recom-wrapper, .reader-topbar"
  800. ];
  801. let elem_list = document.querySelectorAll(selectors.join(", "));
  802. for (let elem of elem_list) {
  803. utils.tryToRemoveElement(elem);
  804. }
  805. let nut_selector = ".fix-searchbar-wrap, #hd, .try-end-fold-page";
  806. utils.forceHide(nut_selector);
  807.  
  808. // 页边距调整
  809. // 顶部距离改为0
  810. let rc = document.querySelector("#reader-container");
  811. rc.style.paddingTop = "0";
  812. let cw = document.querySelector(".content-wrapper");
  813. cw.style.paddingTop = "0";
  814. // 底部距离改为0
  815. let foot = document.querySelector(".try-end-fold-page");
  816. foot.style.paddingBottom = "0";
  817. foot.style.height = "0";
  818. }
  819.  
  820.  
  821. /**
  822. * 调整页间距为 width px
  823. */
  824. function adjustPageGap() {
  825. let old_gap = window.baiduJS.page_gap;
  826. let hints = [
  827. `旧的页间距为 ${old_gap} px`,
  828. "请输入新的页间距(0-500的整数):\n"
  829. ];
  830. let new_gap = prompt(hints.join("\n"));
  831. new_gap = parseInt(new_gap);
  832.  
  833. // 创建空白段落节点充当间隔
  834. let div = document.createElement("div");
  835. // 取得背景色
  836. let app = document.querySelector("#app");
  837. let color = getComputedStyle(app).backgroundColor;
  838. // 取得实心填充物
  839. let block = document.querySelector("[id*=pageNo] canvas").cloneNode(true);
  840. block.style.height = `${new_gap}px`;
  841. // 创建间隔
  842. div.style.background = color;
  843. div.appendChild(block);
  844. div.className = "page-gap";
  845.  
  846. // 调整页间距
  847. document.querySelectorAll("[id*=pageNo]").forEach((elem) => {
  848. let next_elem = elem.nextElementSibling;
  849.  
  850. if (next_elem === null) {
  851. return; // 最后一个节点后面无需间隔
  852. }
  853.  
  854. let cls = next_elem.className;
  855. if (cls === "page-gap") {
  856. next_elem.style.height = `${new_gap}px`;
  857. } else {
  858. utils.insertAfter(div.cloneNode(true), elem);
  859. }
  860. });
  861. window.baiduJS.page_gap = new_gap;
  862. console.log(`页间距已经调整为:${new_gap} px`);
  863. }
  864.  
  865.  
  866. /**
  867. * 判断是否所有可预览页面都冻结了
  868. * @returns {Boolean}
  869. */
  870. function areAllFrozen() {
  871. let frozen = 0;
  872. document.querySelectorAll("[id*=pageNo] canvas").forEach((canvas) => {
  873. if (canvas.getAttribute("width") !== "0") {
  874. frozen += 1;
  875. }
  876. });
  877. if (frozen < window.free_page) {
  878. return false;
  879. }
  880. return true;
  881. }
  882.  
  883.  
  884. /**
  885. * 移除canvas上的id,切断bdimg.com/.../view/readerxxx.js对数据渲染的控制。适用于百度文库的文档
  886. */
  887. function freezeDocView() {
  888. document.querySelectorAll("[id*=pageNo] canvas").forEach((canvas) => {
  889. if (canvas.getAttribute("width") !== "0") {
  890. canvas.id = "";
  891. }
  892. });
  893.  
  894. if (areAllFrozen()) {
  895. // 已经冻结完全部文档页元素,移除滚动事件的绑定函数
  896. console.log("wk: 文档页: 全部冻结完毕");
  897. window.baiduJS.finished = true;
  898. window.onscroll = () => { };
  899. }
  900. }
  901.  
  902.  
  903. /**
  904. * 展开文档
  905. */
  906. function readAll$1() {
  907. let btn = document.querySelector(".read-all");
  908. if (!btn) {
  909. // 显示按钮
  910. utils.toggleBtnStatus("btn_1");
  911. utils.toggleBtnStatus("btn_2");
  912. utils.toggleBtnStatus("btn_3");
  913. } else {
  914. btn.click();
  915. }
  916. }
  917.  
  918.  
  919. function getTips() {
  920. let hints = [
  921. `一共 ${window.all_page} 页,`,
  922. `免费预览 ${window.free_page} 页,`,
  923. "只能导出可以预览的页面。",
  924. "",
  925. "如果点击展开文档,却跳转到vip付费,",
  926. "但明明<免费预览页数>等于<总页数>,",
  927. "请刷新页面重试, 这是百度的问题, 并非脚本问题。",
  928. "",
  929. "如果出现空白页,",
  930. "请浏览对应页面使其加载,",
  931. "然后再打印页面。",
  932. "",
  933. "页面间距通过按钮调整。",
  934. "页面宽度通过打印时缩放比调整。",
  935. "推荐缩放比: 114%",
  936. "",
  937. "打印时设置:",
  938. "更多设置 -> 缩放 -> 自定义",
  939. "选项 -> ☑ 背景图形",
  940. "",
  941. "已知, 与【🔥🔥🔥文本选中复制🔥🔥🔥】冲突,",
  942. "应该是此脚本删去文档页id所导致的,",
  943. "暂无解决方案, 如需复制文字请禁用此脚本。"
  944. ];
  945. alert(hints.join("\n"));
  946. }
  947.  
  948.  
  949. /**
  950. * 清理页面,然后打印页面
  951. */
  952. function clearThenPrint() {
  953. // 清理页面
  954. clearPage_Baidu();
  955. // 打印页面
  956. utils.hideBtnThenPrint();
  957. }
  958.  
  959.  
  960. /**
  961. * 百度文档下载策略
  962. */
  963. function baiduWenku() {
  964. // 允许打印页面
  965. utils.allowPrint();
  966.  
  967. // 取得页码,创建全局对象
  968. window.free_page = window.pageData.readerInfo.freePage;
  969. window.all_page = window.pageData.readerInfo.page;
  970. window.baiduJS = {
  971. finished: false, // 文档页是否全部冻结
  972. free_page: window.free_page, // 免费页数
  973. all_page: window.all_page, // 全部页数
  974. scroll_count: 0, // 滚动事件触发次数
  975. page_gap: 0 // 页间距
  976. };
  977.  
  978. // 绑定监听器给滚动。在滚动时冻结文档页面
  979. let log = "wk: 文档页: 冻结";
  980. utils.scrollFunc(freezeDocView, window.baiduJS, 50, 70, log);
  981. // window.onscroll = freezeDocView;
  982.  
  983. // 创建按钮
  984. utils.createBtns();
  985. // 按钮1: 展开预览
  986. utils.setBtnEvent(readAll$1, [], "btn_1");
  987. // 按钮2: 清理页面元素,打印页面
  988. utils.setBtnEvent(clearThenPrint, [], "btn_2", "打印页面到PDF");
  989. // 按钮3: 调整页间距(页宽由打印时的缩放比例控制)
  990. utils.setBtnEvent(adjustPageGap, [], "btn_3", "调整页间距");
  991. // 按钮4: 提示说明
  992. utils.setBtnEvent(getTips, [], "btn_4", "问题说明");
  993. utils.toggleBtnStatus("btn_4");
  994. }
  995.  
  996. /**
  997. * 展开道客巴巴的文档
  998. */
  999. function readAllDoc88() {
  1000. // 获取“继续阅读”按钮
  1001. let continue_btn = document.querySelector("#continueButton");
  1002. // 如果存在“继续阅读”按钮
  1003. if (continue_btn) {
  1004. // 跳转到文末(等同于展开全文)
  1005. let cur_page = document.querySelector("#pageNumInput");
  1006. // 取得最大页码
  1007. let page_max = cur_page.parentElement.textContent.replace(" / ", "");
  1008. // 跳转到尾页
  1009. utils.jump2pageNo(cur_page, page_max, "keypress");
  1010. // 返回顶部
  1011. setTimeout(utils.jump2pageNo(cur_page, "1", "keypress"), 1000);
  1012. }
  1013. // 文档展开后,显示按钮2、3
  1014. else {
  1015. // 隐藏按钮
  1016. utils.toggleBtnStatus("btn_1");
  1017. // 显示按钮
  1018. utils.toggleBtnStatus("btn_2");
  1019. utils.toggleBtnStatus("btn_3");
  1020. }
  1021. }
  1022.  
  1023. /**
  1024. * 道客巴巴文档下载策略
  1025. */
  1026. function doc88() {
  1027. // 创建脚本启动按钮1、2
  1028. utils.createBtns();
  1029.  
  1030. // 绑定主函数
  1031. let prepare = function() {
  1032. // 获取canvas元素列表
  1033. let node_list = document.querySelectorAll(".inner_page");
  1034. // 获取文档标题
  1035. let title;
  1036. if (document.querySelector(".doctopic h1")) {
  1037. title = document.querySelector(".doctopic h1").title;
  1038. } else {
  1039. title = "文档";
  1040. }
  1041. return [node_list, title];
  1042. };
  1043.  
  1044. // btn_1: 展开文档
  1045. utils.setBtnEvent(() => {
  1046. readAllDoc88();
  1047. }, [], "btn_1");
  1048. // btn_2: 导出zip
  1049. utils.setBtnEvent(() => {
  1050. if (confirm("确定每页内容都加载完成了吗?")) {
  1051. utils.saveCanvasesToZip(...prepare());
  1052. }
  1053. }, [], "btn_2", "导出图片到zip");
  1054. // btn_3: 导出PDF
  1055. utils.setBtnEvent(() => {
  1056. if (confirm("确定每页内容都加载完成了吗?")) {
  1057. utils.saveCanvasesToPDF(...prepare());
  1058. }
  1059. }, [], "btn_3", "导出图片到PDF");
  1060. }
  1061.  
  1062. // 绑定主函数
  1063. function getCanvasList() {
  1064. // 获取全部canvas元素,用于传递canvas元素列表给 btn_2 和 btn_3
  1065. let parent_node_list = document.querySelectorAll(".hkswf-content");
  1066. let node_list = [];
  1067. for (let node of parent_node_list) {
  1068. node_list.push(node.children[0]);
  1069. }
  1070. return node_list;
  1071. }
  1072.  
  1073.  
  1074. function prepare() {
  1075. // 获取canvas元素列表
  1076. let node_list = getCanvasList();
  1077. // 获取文档标题
  1078. let title;
  1079. if (document.querySelector("h1 [title=doc]")) {
  1080. title = document.querySelector("h1 [title=doc]").nextElementSibling.textContent;
  1081. } else if (document.querySelector(".doc_title")) {
  1082. title = document.querySelector(".doc_title").textContent;
  1083. } else {
  1084. title = "文档";
  1085. }
  1086. return [node_list, title];
  1087. }
  1088.  
  1089.  
  1090. // 判断是否有canvas元素
  1091. function detectCanvas() {
  1092. let haveCanvas = getCanvasList().length === 0 ? false : true;
  1093.  
  1094. // 隐藏按钮
  1095. utils.toggleBtnStatus("btn_1");
  1096. // 显示按钮
  1097. utils.toggleBtnStatus("btn_2");
  1098.  
  1099. // 如果没有canvas元素,则认为文档页面由外链图片构成
  1100. if (!haveCanvas) {
  1101. // btn_2: 导出图片链接
  1102. utils.setBtnEvent(() => {
  1103. if (confirm("确定每页内容都加载完成了吗?")) {
  1104. utils.savePicUrls("[id*=img_]");
  1105. }
  1106. }, [], "btn_2", "导出全部图片链接");
  1107. } else {
  1108. // 显示按钮3
  1109. utils.toggleBtnStatus("btn_3");
  1110. // btn_2: 导出zip
  1111. utils.setBtnEvent(() => {
  1112. if (confirm("确定每页内容都加载完成了吗?")) {
  1113. utils.saveCanvasesToZip(...prepare());
  1114. }
  1115. }, [], "btn_2", "导出图片到zip");
  1116. // btn_3: 导出PDF
  1117. utils.setBtnEvent(() => {
  1118. if (confirm("确定每页内容都加载完成了吗?")) {
  1119. utils.saveCanvasesToPDF(...prepare());
  1120. }
  1121. }, [], "btn_3", "导出图片到PDF");
  1122. }
  1123. }
  1124.  
  1125.  
  1126. /**
  1127. * 豆丁文档下载策略
  1128. */
  1129. function docin() {
  1130. // 创建脚本启动按钮
  1131. utils.createBtns();
  1132.  
  1133. // 隐藏底部工具栏
  1134. document.querySelector("#j_select").click(); // 选择指针
  1135. let tool_bar = document.querySelector(".reader_tools_bar_wrap.tools_bar_small.clear");
  1136. tool_bar.style.display = "none";
  1137.  
  1138. // btn_1: 判断文档类型
  1139. utils.setBtnEvent(() => {
  1140. utils.forceHide(".jz_watermark");
  1141. detectCanvas();
  1142. }, [], "btn_1", "判断文档类型");
  1143. }
  1144.  
  1145. /**
  1146. * 点击“展开继续阅读”,适用性:爱尚共享资料
  1147. */
  1148. function readAlliShare() {
  1149. // 获取“继续阅读”元素
  1150. let red_btn = document.getElementsByClassName("red-color")[0];
  1151. let red_text = red_btn.textContent;
  1152. // 如果可以展开,则展开
  1153. if (red_text.search("点击可继续阅读") !== -1) {
  1154. red_btn.click();
  1155. setTimeout(readAlliShare, 1000);
  1156. }
  1157. // 否则启动按钮2,准备清理页面然后打印为PDF
  1158. else {
  1159. // 隐藏按钮
  1160. utils.toggleBtnStatus("btn_1");
  1161. // 显示按钮
  1162. utils.toggleBtnStatus("btn_2");
  1163. utils.toggleBtnStatus("btn_3");
  1164.  
  1165. // 显示svg图片的链接
  1166. let page1 = document.querySelector('[data-num="1"] .data-detail embed');
  1167. if (!page1) {
  1168. // 如果不存在svg图形,终止后续代码
  1169. console.log("当前页面不存在svg图形");
  1170. return;
  1171. }
  1172. let page2 = document.querySelector('[data-num="2"] .data-detail embed');
  1173. let [svg1_src_div, svg2_src_div] = [document.createElement("div"), document.createElement("div")];
  1174. svg1_src_div.innerHTML = `<div id="src-1"
  1175. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  1176. 访问以下链接以复制文字:<br>${page1.src}
  1177. </div>`;
  1178. svg2_src_div.innerHTML = `<div id="src-1"
  1179. style="font-weight: bold;font-size: 20px; height: 100px; width: 100%">
  1180. 访问以下链接以复制文字:<br>${page2.src}
  1181. </div>`;
  1182. // 添加到页面上
  1183. page1.parentElement.parentElement.parentElement.append(svg1_src_div);
  1184. page2.parentElement.parentElement.parentElement.append(svg2_src_div);
  1185. }
  1186. }
  1187.  
  1188.  
  1189. /**
  1190. * 清理并打印爱问共享资料的文档页
  1191. * @returns 如果输入偏移量非法,返回空值以终止函数
  1192. */
  1193. function printPageiShare() {
  1194. // # 清理并打印爱问共享资料的文档页
  1195. // ## 移除页面上无关的元素
  1196. // ### 移除单个元素
  1197. let topbanner = document.getElementsByClassName("detail-topbanner")[0];
  1198. let header = document.getElementsByClassName("new-detail-header")[0];
  1199. let fixright = document.getElementById("fix-right");
  1200. let redpacket = document.getElementsByClassName("loginRedPacket-dialog")[0];
  1201. let fixedrightfull = document.getElementsByClassName("fixed-right-full")[0];
  1202. let footer = document.getElementsByClassName("website-footer")[0];
  1203. let guess = document.getElementsByClassName("guess-you-like-warpper")[0];
  1204. let detailtopbox = document.getElementsByClassName("detail-top-box")[0];
  1205. let fullscreen = document.getElementsByClassName("reader-fullScreen")[0];
  1206. let endhint = document.getElementsByClassName("endof-trial-reading")[0];
  1207. let crumb_arrow;
  1208. try { crumb_arrow = document.getElementsByClassName("crumb-arrow")[0].parentElement; } catch (e) { console.log(); }
  1209. let copyright = document.getElementsByClassName("copyright-container")[0];
  1210. let state_btn = document.getElementsByClassName("state-bottom")[0];
  1211. let comments = document.getElementsByClassName("user-comments-wrapper")[0];
  1212. // ### 执行移除
  1213. let elem_list = [
  1214. topbanner,
  1215. header,
  1216. fixright,
  1217. redpacket,
  1218. fixedrightfull,
  1219. footer,
  1220. guess,
  1221. detailtopbox,
  1222. fullscreen,
  1223. endhint,
  1224. crumb_arrow,
  1225. copyright,
  1226. state_btn,
  1227. comments
  1228. ];
  1229. for (let elem of elem_list) {
  1230. utils.tryToRemoveElement(elem);
  1231. }
  1232. // ### 移除全部同类元素
  1233. let elem_list_2 = document.querySelectorAll(".tui-detail, .adv-container");
  1234. for (let elem_2 of elem_list_2) {
  1235. utils.tryToRemoveElement(elem_2);
  1236. }
  1237. // 使文档居中
  1238. alert("建议使用:\n偏移量: 18\n缩放: 默认\n如果预览中有广告,就取消打印\n再点一次按钮,预览中应该就没有广告了");
  1239. if (!utils.centerDoc("doc-main", "18")) {
  1240. return; // 如果输入非法,终止函数调用
  1241. }
  1242. // 隐藏按钮,然后打印页面
  1243. utils.hideBtnThenPrint();
  1244. }
  1245.  
  1246.  
  1247. /**
  1248. * 爱问共享资料文档下载策略
  1249. */
  1250. function ishare() {
  1251. // 创建脚本启动按钮1、2
  1252. utils.createBtns();
  1253.  
  1254. // btn_1: 展开文档
  1255. utils.setBtnEvent(readAlliShare, [], "btn_1");
  1256. // btn_2: 导出图片链接
  1257. utils.setBtnEvent(() => {
  1258. utils.savePicUrls(".data-detail");
  1259. }, [], "btn_2", "导出图片链接(推荐)");
  1260. // btn_3: 打印页面到PDF
  1261. utils.setBtnEvent(printPageiShare, [], "btn_3", "打印页面到PDF");
  1262.  
  1263. // 移除底部下载条
  1264. let detailfixed = document.getElementsByClassName("detail-fixed")[0];
  1265. utils.tryToRemoveElement(detailfixed);
  1266. }
  1267.  
  1268. /**
  1269. * 清理并打印得力文库的文档页
  1270. */
  1271. function printPageDeliwenku() {
  1272. // 移除页面上的无关元素
  1273. let selector = ".hr-wrap, #readshop, .nav_uis, .bookdesc, #boxright, .QQ_S1, .QQ_S, #outer_page_more, .works-manage-box.shenshu, .works-intro, .mt10.related-pic-box, .mt10.works-comment, .foot_nav, .siteInner";
  1274. let elem_list = document.querySelectorAll(selector);
  1275. for (let elem of elem_list) {
  1276. utils.tryToRemoveElement(elem);
  1277. }
  1278. // 修改页间距
  1279. let outer_pages = document.getElementsByClassName("outer_page");
  1280. for (let page of outer_pages) {
  1281. page.style.marginBottom = "20px";
  1282. }
  1283. // 使文档居中
  1284. alert("建议使用:\n偏移量: 3\n缩放: 112\n请上下滚动页面,确保每页内容都加载完成以避免空白页\n如果预览时有空白页或文末有绿色按钮,请取消打印重试");
  1285. if (!utils.centerDoc("#boxleft", "3")) {
  1286. return; // 如果输入非法,终止函数调用
  1287. }
  1288. // 打印文档
  1289. utils.hideBtnThenPrint();
  1290. }
  1291.  
  1292.  
  1293. /**
  1294. * 点击“继续阅读”,适用性:得力文库
  1295. */
  1296. function readAllDeliwenku() {
  1297. // 点击“同意并开始预览全文”
  1298. let start_btn = document.getElementsByClassName("pre_button")[0];
  1299. let display = start_btn.parentElement.parentElement.style.display;
  1300. // 如果该按钮显示着,则点击,然后滚动至页面底部,最后终止函数
  1301. if (!display) {
  1302. start_btn.children[0].click();
  1303. setTimeout(() => {
  1304. scroll(0, document.body.scrollHeight);
  1305. }, 200);
  1306. return;
  1307. }
  1308. // 增强按钮点击效果
  1309. utils.enhanceBtnClickReaction();
  1310.  
  1311. let read_all_btn = document.getElementsByClassName("fc2e")[0];
  1312. let display2 = read_all_btn.parentElement.parentElement.style.display;
  1313. // 继续阅读
  1314. if (display2 !== "none") {
  1315. // 获取input元素
  1316. let cur_page = document.querySelector("#pageNumInput");
  1317. let page_old = cur_page.value;
  1318. let page_max = cur_page.parentElement.nextElementSibling.textContent.replace(" / ", "");
  1319. // 跳转到尾页
  1320. utils.jump2pageNo(cur_page, page_max, "keydown");
  1321. // 跳转回来
  1322. utils.jump2pageNo(cur_page, page_old, "keydown");
  1323.  
  1324. // 切换按钮准备导出
  1325. } else {
  1326. // 推荐导出图片链接
  1327. utils.modifyBtnText("btn_2", null, true);
  1328. // 隐藏按钮
  1329. utils.toggleBtnStatus("btn_1");
  1330. // 显示按钮
  1331. utils.toggleBtnStatus("btn_2");
  1332. utils.toggleBtnStatus("btn_3");
  1333. // btn_3 橙色按钮
  1334. utils.setBtnEvent(printPageDeliwenku, [], "btn_3", "打印页面到PDF");
  1335. }
  1336. }
  1337.  
  1338.  
  1339. /**
  1340. * 得力文库文档下载策略
  1341. */
  1342. function deliwenku() {
  1343. // 创建脚本启动按钮1、2
  1344. utils.createBtns();
  1345.  
  1346. // btn_1: 展开文档
  1347. utils.setBtnEvent(readAllDeliwenku, [], "btn_1");
  1348. // btn_2: 导出图片链接
  1349. utils.setBtnEvent(() => {
  1350. if (confirm("确定每页内容都加载完成了吗?")) {
  1351. utils.savePicUrls('.inner_page div');
  1352. }
  1353. }, [], "btn_2", "导出图片链接");
  1354.  
  1355. // 尝试关闭页面弹窗
  1356. try { document.querySelector("div[title=点击关闭]").click(); } catch (e) { console.log(0); }
  1357. // 解除打印限制
  1358. utils.allowPrint();
  1359. }
  1360.  
  1361. function readAll360Doc() {
  1362. // 展开文档
  1363. document.querySelector(".article_showall a").click();
  1364. // 隐藏按钮
  1365. utils.toggleBtnStatus("btn_1");
  1366. // 显示按钮
  1367. utils.toggleBtnStatus("btn_2");
  1368. utils.toggleBtnStatus("btn_3");
  1369. }
  1370.  
  1371.  
  1372. function saveText_360Doc() {
  1373. // 捕获图片链接
  1374. let images = document.querySelectorAll("#artContent img");
  1375. let content = [];
  1376.  
  1377. for (let i = 0; i < images.length; i++) {
  1378. let src = images[i].src;
  1379. content.push(`图${i+1},链接:${src}`);
  1380. }
  1381. // 捕获文本
  1382. let text = document.querySelector("#artContent").textContent;
  1383. content.push(text);
  1384.  
  1385. // 保存纯文本文档
  1386. let title = document.querySelector("#titiletext").textContent;
  1387. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1388. }
  1389.  
  1390.  
  1391. function printPage360Doc() {
  1392. // # 清理并打印360doc的文档页
  1393. // ## 移除页面上无关的元素
  1394. let selector = ".fontsize_bgcolor_controler, .atfixednav, .header, .a_right, .article_data, .prev_next, .str_border, .youlike, .new_plbox, .str_border, .ul-similar, #goTop2, #divtort, #divresaveunder, .bottom_controler, .floatqrcode";
  1395. let elem_list = document.querySelectorAll(selector);
  1396. let under_doc_1, under_doc_2;
  1397. try {
  1398. under_doc_1 = document.querySelector("#bgchange p.clearboth").nextElementSibling;
  1399. under_doc_2 = document.querySelector("#bgchange").nextElementSibling.nextElementSibling;
  1400. } catch (e) { console.log(); }
  1401. // 执行移除
  1402. for (let elem of elem_list) {
  1403. utils.tryToRemoveElement(elem);
  1404. }
  1405. utils.tryToRemoveElement(under_doc_1);
  1406. utils.tryToRemoveElement(under_doc_2);
  1407. // 执行隐藏
  1408. document.querySelector("a[title]").style.display = "none";
  1409.  
  1410. // 使文档居中
  1411. alert("建议使用:\n偏移量: 20\n缩放: 默认\n");
  1412. if (!utils.centerDoc(".a_left", "20")) {
  1413. return; // 如果输入非法,终止函数调用
  1414. }
  1415. // 隐藏按钮,然后打印页面
  1416. utils.hideBtnThenPrint();
  1417. }
  1418.  
  1419.  
  1420. /**
  1421. * 360doc个人图书馆下载策略
  1422. */
  1423. function doc360() {
  1424. // 创建按钮区
  1425. utils.createBtns();
  1426. // btn_1: 展开文档
  1427. utils.setBtnEvent(readAll360Doc, [], "btn_1");
  1428. // btn_2: 导出纯文本
  1429. utils.setBtnEvent(saveText_360Doc, [], "btn_2", "导出纯文本");
  1430. // btn_3: 打印页面到PDF
  1431. utils.setBtnEvent(() => {
  1432. if (confirm("确定每页内容都加载完成了吗?")) {
  1433. printPage360Doc();
  1434. }
  1435. }, [], "btn_3", "打印页面到PDF");
  1436. }
  1437.  
  1438. /**
  1439. * 查找出所有未被捕获的页码,并返回列表
  1440. * @returns 未捕获页码列表
  1441. */
  1442. function getMissedPages() {
  1443. let all = []; // 全部页码
  1444. for (let i = 0; i < window.mbaJS.max_page; i++) {
  1445. all[i] = i + 1;
  1446. }
  1447. let missed = []; // 未捕获页码
  1448. let possessed = Array.from(window.mbaJS.canvases_map.keys()); // 已捕获页面
  1449.  
  1450. // 排除并录入未捕获页码
  1451. for (let num of all) {
  1452. if (!possessed.includes(`page${num}`)) {
  1453. missed.push(num);
  1454. }
  1455. }
  1456. return missed;
  1457. }
  1458.  
  1459.  
  1460. /**
  1461. * 根据键中的id数字对map排序
  1462. * @param {Map} elems_map
  1463. * @returns sorted_map
  1464. */
  1465. function sortMapByID$1(elems_map) {
  1466. // id形式:page2
  1467. let elems_arr = Array.from(elems_map);
  1468. elems_arr.sort((item1, item2) => {
  1469. // 从key中取出id
  1470. let id1 = parseInt(item1[0].replace("page", ""));
  1471. let id2 = parseInt(item2[0].replace("page", ""));
  1472. // 升序排序
  1473. return id1 - id2;
  1474. });
  1475. // 返回排序好的map
  1476. return new Map(elems_arr);
  1477. }
  1478.  
  1479.  
  1480. /**
  1481. * 存储动态加载的canvas元素、textContent
  1482. */
  1483. function storeElements_MBA() {
  1484. let canvases_map = window.mbaJS.canvases_map;
  1485. let texts_map = window.mbaJS.texts_map;
  1486. let quality = window.mbaJS.quality;
  1487.  
  1488. document.querySelectorAll(".page[data-loaded=true]").forEach(
  1489. (elem) => {
  1490. let capture = (elem) => {
  1491. // (1) 存储页面为canvas图形
  1492. let canvas, data_base64;
  1493. // 导出canvas数据防止丢失
  1494. try {
  1495. // 存储canvas
  1496. canvas = elem.querySelector("canvas[id*=page]");
  1497. if (window.mbaJS.only_text) {
  1498. data_base64 = null;
  1499. } else {
  1500. data_base64 = canvas.toDataURL("image/jpeg", quality);
  1501. }
  1502. } catch (e) {
  1503. // utils.sleep(500);
  1504. return;
  1505. }
  1506. // 增量录入map
  1507. let id = canvas.id; // id的形式:page2
  1508. if (!canvases_map.has(id)) {
  1509. canvases_map.set(id, data_base64);
  1510. }
  1511. // 确定canvas长宽
  1512. if (!window.mbaJS.only_text && !window.mbaJS.width) {
  1513. window.mbaJS.width = parseInt(canvas.width);
  1514. window.mbaJS.height = parseInt(canvas.height);
  1515. }
  1516.  
  1517. // (2) 存储text
  1518. let text = elem.textContent;
  1519. if (!texts_map.has(id)) {
  1520. texts_map.set(id, text);
  1521. }
  1522. };
  1523. setTimeout(capture, 500, elem);
  1524. });
  1525. if (canvases_map.size === window.mbaJS.max_page) {
  1526. // 根据id排序
  1527. window.mbaJS.canvases_map = sortMapByID$1(window.mbaJS.canvases_map);
  1528. window.mbaJS.texts_map = sortMapByID$1(window.mbaJS.texts_map);
  1529. window.mbaJS.finished = true;
  1530. window.onscroll = null;
  1531. }
  1532. }
  1533.  
  1534.  
  1535. /**
  1536. * 将canvas转为jpeg,然后导出PDF
  1537. * @param {Array} base64_list canvas元素列表
  1538. * @param {String} title 文档标题
  1539. */
  1540. function saveCanvasesToPDF_MBA(base64_list, title) {
  1541. let width = window.mbaJS.width;
  1542. let height = window.mbaJS.height;
  1543.  
  1544. console.log(`canvas数据:宽: ${width}px,高: ${height}px`);
  1545. // 如果文档第一页的宽比长更大,则landscape,否则portrait
  1546. let orientation = width > height ? 'l' : 'p';
  1547. let pdf = new jspdf.jsPDF(orientation, 'px', [height, width]);
  1548.  
  1549. // 保存每一页文档到每一页pdf
  1550. let i = 0;
  1551. for (let base64 of base64_list) {
  1552. i += 1;
  1553. pdf.addImage(base64, 'JPEG', 0, 0, width, height);
  1554. // 如果当前不是文档最后一页,则需要添加下一个空白页
  1555. if (i < window.mbaJS.max_page) {
  1556. pdf.addPage();
  1557. }
  1558. }
  1559. // 导出文件
  1560. pdf.save(`${title}.pdf`);
  1561. }
  1562.  
  1563. /**
  1564. * 判断文档页是否收集完毕,当不行时给出提示
  1565. * @returns boolean
  1566. */
  1567. function ready2use() {
  1568. removeAds(); // 顺便清理广告
  1569. // 如果是首次点击按钮,给出提示
  1570. if (window.mbaJS.first_hint) {
  1571. let hint = [
  1572. "如果浏览速度过快,比如:",
  1573. "当前页面还没完全加载好就滚动页面去看下一页",
  1574. "那就极有可能导致导出的PDF有空白页或文本有缺漏",
  1575. "由防范技术的干扰,该功能目前很不好用,见谅"
  1576. ].join("\n");
  1577. alert(hint);
  1578. window.mbaJS.first_hint = false;
  1579. }
  1580. // 如果文档页没有收集完,给出提示
  1581. if (!window.mbaJS.finished) {
  1582. let hint = [
  1583. "仍有内容未加载完,无法使用该功能",
  1584. "建议从头到尾慢速地再浏览一遍",
  1585. "以下是没有加载完成页面的页码:",
  1586. getMissedPages().join(",")
  1587. ];
  1588. alert(hint.join("\n"));
  1589. return false;
  1590. }
  1591. return true;
  1592. }
  1593.  
  1594.  
  1595. /**
  1596. * 用捕获好的canvas转jpg,生成PDF
  1597. * @returns
  1598. */
  1599. function canvas2PDF_mba() {
  1600. if (!ready2use()) {
  1601. return;
  1602. }
  1603. let canvases = window.mbaJS.canvases_map.values();
  1604. // 导出PDF
  1605. let title = document.title.split("-")[0].trim();
  1606. saveCanvasesToPDF_MBA(canvases, title);
  1607. }
  1608.  
  1609.  
  1610. /**
  1611. * 拼合捕获好的文本,保存到txt文件
  1612. * @returns
  1613. */
  1614. function saveText_mba() {
  1615. if (!ready2use()) {
  1616. return;
  1617. }
  1618. let content = Array.from(window.mbaJS.texts_map.values());
  1619. let title = document.title.split("-")[0].trim();
  1620. utils.createAndDownloadFile(`${title}.txt`, content.join("\n"));
  1621. }
  1622.  
  1623.  
  1624. /**
  1625. * 移除广告
  1626. */
  1627. function removeAds() {
  1628. document.querySelectorAll(".doc-ad").forEach((ad_elem) => {
  1629. utils.tryToRemoveElement(ad_elem);
  1630. });
  1631. }
  1632.  
  1633.  
  1634. function mbalib_() {
  1635. // 移除广告和左侧工具栏
  1636. removeAds();
  1637. let tool_bar = document.querySelector(".tool-bar");
  1638. utils.tryToRemoveElement(tool_bar);
  1639.  
  1640. // 创建按钮
  1641. utils.createBtns();
  1642. // 隐藏按钮
  1643. utils.toggleBtnStatus("btn_1");
  1644. // 显示按钮
  1645. utils.toggleBtnStatus("btn_2");
  1646. utils.toggleBtnStatus("btn_3");
  1647. utils.toggleBtnStatus("btn_4");
  1648.  
  1649. // 取得页数
  1650. let max_page = parseInt(document.querySelector("#numPages").textContent.replace("/ ", ""));
  1651. let quality = utils.getQualityByCanvasAmount(max_page);
  1652.  
  1653. // 为导出内容提供全局变量,便于动态收集文档页元素的存取
  1654. window.mbaJS = {
  1655. max_page: max_page,
  1656. texts_map: new Map(), // id: text
  1657. canvases_map: new Map(), // id: canvas_data_base64
  1658. quality: quality, // canvas转jpg的质量
  1659. width: null, // canvas宽度(px)
  1660. height: null,
  1661. finished: false, // 是否收集完了全部文档页元素
  1662. first_hint: true,
  1663. scroll_count: 0, // 用于统计累计触发scroll的次数,
  1664. only_text: false // 是否仅捕获文本
  1665. };
  1666. // 跟随浏览,动态收集页面元素
  1667. window.onscroll = () => {
  1668. storeElements_MBA();
  1669. };
  1670. // 跟随浏览,动态收集页面元素
  1671. utils.scrollFunc(storeElements_MBA, window.mbaJS, 20, 50, "mba元素: 收集");
  1672. // 绑定事件
  1673. utils.setBtnEvent(saveText_mba, [], "btn_2", "导出纯文本(不稳定)");
  1674. utils.setBtnEvent(canvas2PDF_mba, [], "btn_3", "导出PDF(不稳定)");
  1675.  
  1676. // 根据页数决定按钮功能:<40页,导出文本+导出pdf,>40页:导出文本
  1677. let btn_text, aim_btn, hint;
  1678. if (max_page > 40) {
  1679. btn_text = "失效说明";
  1680. aim_btn = "btn_3";
  1681. hint = [
  1682. "页数超过40,脚本无效",
  1683. "只能使用导出文本功能",
  1684. "而此脚本会使页面内容加载明显变慢,建议禁用"
  1685. ];
  1686. utils.setBtnEvent(utils.banSelf, [
  1687. () => { window.onscroll = null; }
  1688. ], "btn_4", "临时禁用脚本");
  1689. } else {
  1690. btn_text = "空白页说明";
  1691. aim_btn = "btn_4";
  1692. hint = [
  1693. "导致空白页的原因如下",
  1694. "加载该页的时间超过2秒 / 明显等待",
  1695. "而此脚本会使页面内容加载明显变慢,如果影响严重请禁用"
  1696. ];
  1697. }
  1698.  
  1699. utils.setBtnEvent(() => {
  1700. alert(hint.join("\n"));
  1701. }, [], aim_btn, btn_text);
  1702. }
  1703.  
  1704.  
  1705. function mbalib() {
  1706. setTimeout(mbalib_, 2000);
  1707. }
  1708.  
  1709. // 拼接swf: https://pan.baidu.com/s/1PTM6watxNlqs-jvvX6XKzg?pwd=abe9 中的 JoinSWFFiles_setup.exe
  1710. // swf转pdf: https://youfiles.herokuapp.com/swftopdf/
  1711.  
  1712.  
  1713. /**
  1714. * 统计文档页的数量
  1715. * @param {String} inner_selector 【信息摘要】元素选择器
  1716. * @returns 文档页的数量
  1717. */
  1718. function countPages(inner_selector = ".container div[style=' margin:20px; ']") {
  1719. let abstract = inner_window.document.querySelector(inner_selector).textContent;
  1720. let page_amount_pattern = /文档页数:共 ([1-9]|[1-9][0-9]|[1-9][0-9][0-9]) 页/;
  1721. // 捕获到: ["文档页数:共 xx 页", "xx"]
  1722. let max_page = parseInt(abstract.match(page_amount_pattern)[1]);
  1723. return max_page;
  1724. }
  1725.  
  1726.  
  1727. /**
  1728. * 判断当前帮帮文档是否为高清版页面
  1729. * @returns 是否为高清
  1730. */
  1731. function isHD() {
  1732. // 取得页面左侧【高清版】切换功能区
  1733. let hd_bar = inner_window.document.querySelector("#gaoging");
  1734. // 取得功能区内提示文字
  1735. let hint = hd_bar.querySelector("#gqts").textContent;
  1736. // 如果存在如下文字,认为当前页面是模糊版,否则是高清版
  1737. if (hint.includes("点此阅读高清版")) {
  1738. return false;
  1739. }
  1740. return true;
  1741. }
  1742.  
  1743.  
  1744. /**
  1745. * 开启收集swf链接任务,隐藏按钮1,显示按钮2、3
  1746. */
  1747. function main$1() {
  1748. // 已经是高清版
  1749. // 跟随浏览,动态冻结页面元素
  1750. utils.scrollFunc(storeSWFLinks_Woc88, window.woc88JS, 10, 30, "woc88元素: 收集", inner_window);
  1751.  
  1752. // 绑定按钮的触发函数
  1753. utils.setBtnEvent(btn2SaveSwfUrls, [], "btn_2", "导出swf链接");
  1754. utils.setBtnEvent(() => {
  1755. let hints = [
  1756. "本脚本无需【flash】。",
  1757. "你的电脑上无需安装任何flash player也可以使用。",
  1758. "导出 media-urls.csv 后,",
  1759. "需要使用【资源下载器】来取得swf文档资源。",
  1760. "详细用法请访问脚本主页: ",
  1761. "https://gf.qytechs.cn/zh-CN/scripts/435884-wenku-doc-downloader"
  1762. ];
  1763. alert(hints.join("\n"));
  1764. }, [], "btn_3", "友情提示");
  1765.  
  1766. // 隐藏按钮
  1767. utils.toggleBtnStatus("btn_1");
  1768. // 显示按钮
  1769. utils.toggleBtnStatus("btn_2");
  1770. utils.toggleBtnStatus("btn_3");
  1771. }
  1772.  
  1773.  
  1774. function switch2HD() {
  1775. // 取得页面左侧【高清版】切换功能区
  1776. let hd_bar = inner_window.document.querySelector("#gaoging");
  1777. // 取得功能区内【切换高清版】按钮
  1778. let hd_button = hd_bar.querySelector("#gqts span[onclick]");
  1779. hd_button.click();
  1780. // 开启主任务
  1781. setTimeout(main$1, 1000);
  1782. }
  1783.  
  1784.  
  1785. /**
  1786. * 根据键中的id数字对map排序
  1787. * @param {Map} elems_map
  1788. * @returns sorted_map
  1789. */
  1790. function sortMapByID(elems_map) {
  1791. // id形式:5, 类型: int
  1792. let elems_arr = Array.from(elems_map);
  1793. elems_arr.sort((id1, id2) => {
  1794. // 升序排序
  1795. return id1 - id2;
  1796. });
  1797. // 返回排序好的map
  1798. return new Map(elems_arr);
  1799. }
  1800.  
  1801.  
  1802. /**
  1803. * 存储swf链接。适用于帮帮文库。
  1804. * @param {String} inner_selector iframe#test 框架下的【swf链接所在元素】选择器
  1805. */
  1806. function storeSWFLinks_Woc88(inner_selector = "div[id*=imgcount] > div > object") {
  1807. let elems_map = window.woc88JS.elems_map;
  1808. inner_window.document.querySelectorAll(inner_selector).forEach(
  1809. (elem) => {
  1810. // 复制链接防止丢失
  1811. // 拿到id
  1812. let id_elem = elem.parentElement.parentElement.id;
  1813. let id = parseInt(id_elem.replace("imgcount", ""));
  1814. // 拿到link
  1815. let link = elem.data;
  1816. // 储存id: link
  1817. elems_map.set(id, link);
  1818. });
  1819. if (elems_map.size === window.woc88JS.max_page) {
  1820. // 根据id排序,保证导出的图片链接不是乱序的
  1821. window.woc88JS.elems_map = sortMapByID(window.woc88JS.elems_map);
  1822. // 已经保存完全部文档页元素,移除滚动事件的绑定函数
  1823. window.woc88JS.finished = true;
  1824. inner_window.removeEventListener("scroll", window.woc88JS.scrollFunc, false);
  1825. }
  1826. }
  1827.  
  1828.  
  1829. /**
  1830. * 导出swf链接到csv文件。需要配合【资源下载器】使用。
  1831. */
  1832. function saveSwfUrls_Woc88() {
  1833. let urls = [];
  1834. window.woc88JS.elems_map.forEach((url) => {
  1835. // 遍历map就是遍历value
  1836. urls.push(url);
  1837. });
  1838. utils.createAndDownloadFile("media-urls.csv", urls.join("\n"));
  1839. }
  1840.  
  1841.  
  1842. /**
  1843. * 返回一个列表,包含所有未捕获的页码
  1844. * @returns 未捕获页码列表
  1845. */
  1846. function getNotStored() {
  1847. // 取得全部页码
  1848. let max_page = window.woc88JS.max_page;
  1849. // 取得未捕获页码
  1850. let stored = new Set(window.woc88JS.elems_map.keys());
  1851. let not_stored = [];
  1852. for (let i = 1; i <= max_page; i++) {
  1853. // 如果当前页码未被捕获,则录入not_stored
  1854. if (!stored.has(i)) {
  1855. not_stored.push(i);
  1856. }
  1857. }
  1858. return not_stored;
  1859. }
  1860.  
  1861.  
  1862. function btn2SaveSwfUrls() {
  1863. if (!window.woc88JS.finished) {
  1864. let hints = [
  1865. "仍有内容未加载完,无法使用该功能",
  1866. "请再次浏览未加载出的页面,未加载的页码如下",
  1867. getNotStored().join(",")
  1868. ];
  1869. alert(hints.join("\n"));
  1870. return;
  1871. }
  1872. saveSwfUrls_Woc88();
  1873. }
  1874.  
  1875.  
  1876. /**
  1877. * 帮帮文库下载策略
  1878. */
  1879. function woc88() {
  1880. // 1 初始环境配置
  1881. // 取得iframe的window
  1882. window.inner_window = document.querySelector("#test").contentWindow;
  1883. // 设置全局变量
  1884. window.woc88JS = {
  1885. max_page: countPages(), // 当前文档页面数量
  1886. finished: false, // 是否收集完了全部文档页元素
  1887. scroll_count: 0, // 用于统计累计触发scroll的次数
  1888. elems_map: new Map(), // 存储已经捕获的元素: {id: element}
  1889. scrollFunc: null
  1890. };
  1891.  
  1892. // 2 主任务
  1893. // 创建按钮组
  1894. utils.createBtns();
  1895. // 如果不是高清版,先切换至高清版
  1896. if (!isHD()) {
  1897. utils.setBtnEvent(switch2HD, [], "btn_1", "高清版");
  1898. return;
  1899. }
  1900. main$1();
  1901. }
  1902.  
  1903. /**
  1904. * 判断是否进入预览模式
  1905. * @returns Boolean
  1906. */
  1907. function isInPreview() {
  1908. let p_elem = document.querySelector("#preview_tips");
  1909. if (p_elem.style.display === "none") {
  1910. return true;
  1911. }
  1912. return false;
  1913. }
  1914.  
  1915.  
  1916. /**
  1917. * 判断是否展开了全文
  1918. * @returns Boolean
  1919. */
  1920. function isNoMorePage() {
  1921. let read_more = document.querySelector("#ntip2");
  1922. if (read_more.style.display === "none") {
  1923. return true;
  1924. }
  1925. return false;
  1926. }
  1927.  
  1928.  
  1929. /**
  1930. * 确保进入预览模式
  1931. */
  1932. function ensureInPreview() {
  1933. if (!isInPreview()) {
  1934. // 如果没有进入预览,则先进入
  1935. document.querySelector(".pre_button a").click();
  1936. utils.sleep(500);
  1937. }
  1938. }
  1939.  
  1940.  
  1941. /**
  1942. * 展开全文预览,当展开完成后再次调用时,返回true
  1943. * @returns
  1944. */
  1945. function unfoldAll() {
  1946. ensureInPreview();
  1947. if (isNoMorePage()) {
  1948. // 如果全文展开了,则切换按钮,然后退出
  1949. utils.toggleBtnStatus("btn_1");
  1950. utils.toggleBtnStatus("btn_2");
  1951. return true;
  1952. }
  1953. // 跳转到最后一页,以展开全文
  1954. let cur_page = document.querySelector("#pageNumInput");
  1955. utils.jump2pageNo(cur_page, "999", "keydown");
  1956. }
  1957.  
  1958.  
  1959. /**
  1960. * 取得最大页码(最大20)
  1961. * @returns {Number} 页码int
  1962. */
  1963. function getPageCounts$1() {
  1964. let counts_str = document.querySelector(".counts").textContent;
  1965. let counts = counts_str.match(/[0-9]{1,3}/)[0];
  1966. if (counts > 20) {
  1967. counts = 20; // 最多免费预览20页,所以设置最大页码20
  1968. }
  1969. return parseInt(counts);
  1970. }
  1971.  
  1972.  
  1973. /**
  1974. * 取得全部文档页面的链接,返回urls;如果有页面未加载,则返回null
  1975. * @returns Array | null
  1976. */
  1977. function getImgUrls() {
  1978. let pages = document.querySelectorAll("[id*=pageflash_]");
  1979. // 尚未浏览完全部页面,返回null
  1980. if (pages.length < window.dugenJS.page_counts) {
  1981. return null;
  1982. }
  1983. // 浏览完全部页面,返回urls
  1984. let urls = [];
  1985. pages.forEach((page) => {
  1986. let url = page.querySelector("img").src;
  1987. urls.push(url);
  1988. });
  1989. return urls;
  1990. }
  1991.  
  1992.  
  1993. /**
  1994. * 返回当前未加载页面的页码
  1995. * @returns not_loaded
  1996. */
  1997. function getNotloadedPages() {
  1998. // 已经取得的页码
  1999. let pages = document.querySelectorAll("[id*=pageflash_]");
  2000. let loaded = new Set();
  2001. pages.forEach((page) => {
  2002. let id = page.id.split("_")[1];
  2003. id = parseInt(id);
  2004. loaded.add(id);
  2005. });
  2006. // 未取得的页码
  2007. let not_loaded = [];
  2008. for (let i = 1; i <= window.dugenJS.page_counts; i++) {
  2009. if (!loaded.has(i)) {
  2010. not_loaded.push(i);
  2011. }
  2012. }
  2013. return not_loaded;
  2014. }
  2015.  
  2016.  
  2017. function WantImgUrls() {
  2018. let res = getImgUrls();
  2019. // 页面尚未加载完
  2020. if (res === null) {
  2021. let hints = [
  2022. "尚未加载完全部页面",
  2023. "以下页面需要浏览并加载:",
  2024. getNotloadedPages().join(",")
  2025. ];
  2026. alert(hints.join("\n"));
  2027. return;
  2028. }
  2029. // 页面全部加载完
  2030. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2031. }
  2032.  
  2033.  
  2034. /**
  2035. * dugen文档下载策略
  2036. */
  2037. function dugen() {
  2038. ensureInPreview();
  2039. // 全局对象
  2040. window.dugenJS = {
  2041. page_counts: getPageCounts$1() // 最大页码(int)
  2042. };
  2043.  
  2044. // 创建按钮区
  2045. utils.createBtns();
  2046.  
  2047. // 绑定监听器
  2048. // 按钮1:展开文档
  2049. utils.setBtnEvent(unfoldAll, [], "btn_1");
  2050. // 按钮2:导出图片链接
  2051. utils.setBtnEvent(WantImgUrls, [], "btn_2", "导出图片链接");
  2052. }
  2053.  
  2054. /**
  2055. * 取得文档类型
  2056. * @returns {String} 文档类型str
  2057. */
  2058. function getDocType() {
  2059. let type_elem = document.querySelector(".title .icon.icon-format");
  2060. // ["icon", "icon-format", "icon-format-doc"]
  2061. let cls_str = type_elem.classList[2];
  2062. // "icon-format-doc"
  2063. let type = cls_str.split("-")[2];
  2064. return type;
  2065. }
  2066.  
  2067.  
  2068. /**
  2069. * 判断文档类型是否为type_list其中之一
  2070. * @returns 是否为type
  2071. */
  2072. function isTypeof(type_list) {
  2073. let type = getDocType();
  2074. if (type_list.includes(type)) {
  2075. return true;
  2076. }
  2077. return false;
  2078. }
  2079.  
  2080.  
  2081. /**
  2082. * 判断文档类型是否为PPT
  2083. * @returns 是否为PPT
  2084. */
  2085. function isPPT() {
  2086. return isTypeof(["ppt", "pptx"]);
  2087. }
  2088.  
  2089.  
  2090. /**
  2091. * 判断文档类型是否为Excel
  2092. * @returns 是否为Excel
  2093. */
  2094. function isEXCEL() {
  2095. return isTypeof(["xls", "xlsm", "xlsx"]);
  2096. }
  2097.  
  2098.  
  2099. /**
  2100. * 取得最大页码
  2101. * @returns 最大页码int
  2102. */
  2103. function getPageCounts() {
  2104. let page_counts_str = document.querySelector(".intro-list").children[3].textContent;
  2105. let page_counts = parseInt(page_counts_str.match(/[0-9]{1,3}(?=页)/)[0]);
  2106. return page_counts;
  2107. }
  2108.  
  2109.  
  2110. /**
  2111. * 取得未加载页面的页码
  2112. * @param {Set} loaded 已加载的页码集合
  2113. * @returns {Array} not_loaded 未加载页码列表
  2114. */
  2115. function getNotLoaded(loaded) {
  2116. let not_loaded = [];
  2117. let page_counts = window.book118JS.page_counts;
  2118. for (let i = 1; i <= page_counts; i++) {
  2119. if (!loaded.has(i)) {
  2120. not_loaded.push(i);
  2121. }
  2122. }
  2123. return not_loaded;
  2124. }
  2125.  
  2126.  
  2127. /**
  2128. * 取得全部文档页的url
  2129. * @returns [<是否全部加载>, <未加载页码列表>|<urls列表>]
  2130. */
  2131. function getUrls() {
  2132. let loaded = new Set(); // 存储已加载页面的页码
  2133. let urls = []; // 存储已加载页面的图形src
  2134. // 收集已加载页面的url
  2135. document.querySelectorAll("div[data-id]").forEach((div) => {
  2136. let src = div.querySelector("img").src;
  2137. if (src) {
  2138. // "1": "https://view-cache.book118.com/..."
  2139. loaded.add(parseInt(div.getAttribute("data-id")));
  2140. urls.push(src);
  2141. }
  2142. });
  2143. // 如果所有页面加载完毕
  2144. if (loaded.size === window.book118JS.page_counts) {
  2145. return [true, urls];
  2146. }
  2147. // 否则收集未加载页面的url
  2148. return [false, getNotLoaded(loaded)];
  2149. }
  2150.  
  2151.  
  2152. /**
  2153. * 展开全文
  2154. */
  2155. function readAll() {
  2156. window.preview.jump(999);
  2157. }
  2158.  
  2159.  
  2160. /**
  2161. * btn_2: 导出图片链接
  2162. */
  2163. function wantUrls() {
  2164. let [flag, res] = getUrls();
  2165. // 页面都加载完毕,下载urls
  2166. if (flag) {
  2167. utils.createAndDownloadFile("urls.csv", res.join("\n"));
  2168. return;
  2169. }
  2170. // 没有加载完,提示出未加载好的页码
  2171. let hints = [
  2172. "仍有页面没有加载",
  2173. "请浏览并加载如下页面:",
  2174. res.join(",")
  2175. ];
  2176. alert(hints.join("\n"));
  2177. }
  2178.  
  2179.  
  2180. /**
  2181. * 打开PPT预览页面
  2182. */
  2183. function openPPTpage() {
  2184. window.preview.getSrc();
  2185. let openPPT = () => {
  2186. let ppt_src = document.querySelector("iframe.preview-iframe").src;
  2187. utils.openInNewTab(ppt_src);
  2188. window.preview.close();
  2189. };
  2190. setTimeout(openPPT, 1000);
  2191. }
  2192.  
  2193.  
  2194. /**
  2195. * 原创力文档(非PPT或Excel)下载策略
  2196. */
  2197. function book118_CommonDoc() {
  2198. // 创建全局对象
  2199. window.book118JS = {
  2200. doc_type: getDocType(),
  2201. page_counts: getPageCounts()
  2202. };
  2203.  
  2204. // 处理非PPT文档
  2205. // 创建按钮组
  2206. utils.createBtns();
  2207. // 绑定监听器到按钮
  2208. // 按钮1:展开文档
  2209. utils.setBtnEvent(() => {
  2210. readAll();
  2211. utils.toggleBtnStatus("btn_1");
  2212. utils.toggleBtnStatus("btn_2");
  2213. }, [], "btn_1");
  2214. // 按钮2:导出图片链接
  2215. utils.setBtnEvent(wantUrls, [], "btn_2", "导出图片链接");
  2216. }
  2217.  
  2218.  
  2219. /**
  2220. * 取得PPT文档最大页码
  2221. * @returns PPT文档最大页码int
  2222. */
  2223. function getPageCountsPPT() {
  2224. let counts_str = document.querySelector("#PageCount").textContent;
  2225. let counts = parseInt(counts_str);
  2226. console.log(`get page counts: ${counts}`);
  2227. return counts;
  2228. }
  2229.  
  2230.  
  2231. /**
  2232. * 转换当前视图为canvas,添加到book118JS.canvases中。在递归终止时显示btn_2。
  2233. * @param {Number} max 转换执行次数,或者说,页面数量
  2234. */
  2235. function docView2Canvas(max, i = 0) {
  2236. // 取得页码
  2237. let cur_page = document.querySelector("#PageIndex").textContent;
  2238. cur_page = parseInt(cur_page);
  2239. // 取得视图元素,计数从0开始
  2240. let doc_view = document.querySelector(`#view${cur_page-1}`);
  2241. // 转化为canvas
  2242. let canvas_promise = html2canvas(doc_view);
  2243. console.log(canvas_promise); // 打印信息以检查状况
  2244. canvas_promise.then((canvas) => {
  2245. // 保存canvas到全局对象
  2246. window.book118JS.canvases.push(canvas);
  2247. // 打印日志
  2248. i += 1;
  2249. console.log(`wk: ${cur_page} complete`);
  2250.  
  2251. // 下一页
  2252. document.querySelector(".btmRight").click();
  2253. utils.sleep(500); // 等待页面加载
  2254. // 如果递归未达到最大次数
  2255. if (i < max) {
  2256. // 则下一次递归
  2257. docView2Canvas(max, i);
  2258. } else {
  2259. // 否则终止递归,并且显示导出PDF按钮
  2260. utils.toggleBtnStatus("btn_2");
  2261. }
  2262. });
  2263. }
  2264.  
  2265.  
  2266. /**
  2267. * 将捕获的canvases合并并导出为pdf
  2268. * @returns
  2269. */
  2270. function canvases2pdf() {
  2271. // 已经捕获的页面数量
  2272. let stored_amount = window.book118JS.canvases.length;
  2273. // 总页面数量
  2274. let page_counts = window.book118JS.page_counts;
  2275. // 校验数量
  2276. let diff = page_counts - stored_amount;
  2277. if (diff > 0) {
  2278. alert(`缺失了 ${diff} 页,可以过一会再点击该按钮试试。`);
  2279. if (!confirm("是否仍要导出PDF?")) {
  2280. // 不坚持导出PDF的情况
  2281. return;
  2282. }
  2283. }
  2284. // 导出PDF
  2285. let canvases = window.book118JS.canvases;
  2286. // 取得宽高
  2287. let model = canvases[0];
  2288. let width = model.width;
  2289. let height = model.height;
  2290. // 取得标题然后导出pdf
  2291. utils.saveCanvasesToPDF(canvases, "原创力PPT文档", width, height);
  2292. }
  2293.  
  2294.  
  2295. /**
  2296. * 原创力文档(PPT)下载策略
  2297. */
  2298. function book118_PPT() {
  2299. // 创建全局对象
  2300. window.book118JS = {
  2301. page_counts: getPageCountsPPT(),
  2302. canvases: [] // 存储每页文档转化的canvas
  2303. };
  2304.  
  2305. // 创建按钮区
  2306. utils.createBtns();
  2307. // 绑定监听器到按钮1
  2308. utils.setBtnEvent(() => {
  2309. let hints = [
  2310. "正在为文档“截图”,请耐心等待过程完成,不要操作",
  2311. "“截图”会有额外一层黑边,原因未知,暂无法处理,烦请谅解"
  2312. ];
  2313. alert(hints.join("\n"));
  2314. // 隐藏按钮1
  2315. utils.toggleBtnStatus("btn_1");
  2316. // 开始捕获页面
  2317. docView2Canvas(window.book118JS.page_counts);
  2318. }, [], "btn_1", "捕获页面");
  2319. // 为按钮2绑定监听器
  2320. utils.setBtnEvent(canvases2pdf, [], "btn_2", "导出PDF");
  2321. }
  2322.  
  2323.  
  2324. /**
  2325. * 取得当前页面的excel,返回csv string
  2326. * @returns {String} csv
  2327. */
  2328. function excel2CSV() {
  2329. let table = [];
  2330. let rows = document.querySelectorAll("tr[id]");
  2331.  
  2332. // 遍历行
  2333. for (let row of rows) {
  2334. let csv_row = [];
  2335. // 遍历列(单元格)
  2336. for (let cell of row.querySelectorAll("td[class*=fi], td.tdrl")) {
  2337. // 判断单元格是否存储图片
  2338. let img = cell.querySelector("img");
  2339. if (img) {
  2340. // 如果是图片,保存图片链接
  2341. csv_row.push(img.src);
  2342. } else {
  2343. // 否则保存单元格文本
  2344. csv_row.push(cell.textContent);
  2345. }
  2346. }
  2347. table.push(csv_row.join(","));
  2348. }
  2349.  
  2350. let csv = table.join("\n");
  2351. csv = csv.replace(/\n{2,}/g, "\n");
  2352. return csv;
  2353. }
  2354.  
  2355.  
  2356. /**
  2357. * 下载当前表格内容,保存为csv(utf-8编码)
  2358. */
  2359. function wantEXCEL() {
  2360. let file_name = "原创力表格_UTF-8.csv";
  2361. utils.createAndDownloadFile(file_name, excel2CSV());
  2362. }
  2363.  
  2364.  
  2365. /**
  2366. * 在Excel预览页面给出操作提示
  2367. */
  2368. function help() {
  2369. let hints = [
  2370. "【导出表格到CSV】只能导出当前sheet,",
  2371. "如果有多张sheet请在每个sheet上用按钮分别导出CSV。",
  2372. "CSV是一种简单的表格格式,可以被Excel打开,",
  2373. "并转为 xls 或 xlsx 格式存储,",
  2374. "但CSV本身不能存储图片,所以用图片链接代替,请自行下载图片",
  2375. "",
  2376. "本功能导出的CSV文件无法直接用Excel打开,因为中文会乱码。",
  2377. "有两个办法:",
  2378. "1. 打开Excel,选择【数据】,选择【从文本/CSV】,",
  2379. " 选择文件,【文件原始格式】选择【65001: Unicode(UTF-8)】,选择【加载】。",
  2380. "2. 用【记事本】打开CSV文件,【文件】->【另存为】->",
  2381. " 【编码】选择【ANSI】->【保存】。现在可以用Excel直接打开它了。"
  2382. ];
  2383. alert(hints.join("\n"));
  2384. }
  2385.  
  2386.  
  2387. /**
  2388. * 原创力文档(EXCEL)下载策略
  2389. */
  2390. function book118_EXCEL() {
  2391. // 创建按钮区
  2392. utils.createBtns();
  2393. // 绑定监听器到按钮
  2394. utils.setBtnEvent(wantEXCEL, [], "btn_1", "导出表格到CSV");
  2395. utils.setBtnEvent(help, [], "btn_2", "使用说明");
  2396. // 显示按钮
  2397. utils.toggleBtnStatus("btn_2");
  2398. }
  2399.  
  2400.  
  2401. /**
  2402. * 打开Excel预览页面
  2403. */
  2404. function openEXCELpage() {
  2405. openPPTpage();
  2406. }
  2407.  
  2408.  
  2409. /**
  2410. * 原创力文档下载策略
  2411. */
  2412. function book118() {
  2413. let host = window.location.hostname;
  2414. if (host === 'max.book118.com') {
  2415. if (isEXCEL()) {
  2416. utils.createBtns();
  2417. utils.setBtnEvent(openEXCELpage, [], "btn_1", "导出EXCEL");
  2418. } else if (isPPT()) {
  2419. utils.createBtns();
  2420. utils.setBtnEvent(openPPTpage, [], "btn_1", "导出PPT");
  2421. } else {
  2422. book118_CommonDoc();
  2423. }
  2424. } else if (host === "view-cache.book118.com") {
  2425. book118_PPT();
  2426. } else if (host.match(/view[0-9]{1,3}.book118.com/)) {
  2427. book118_EXCEL();
  2428. } else {
  2429. console.log(`wk: Unknown host: ${host}`);
  2430. }
  2431. }
  2432.  
  2433. /**
  2434. * 设置图像质量为100
  2435. */
  2436. function HD() {
  2437. window.img_quality = 1;
  2438. console.log("图像质量已经设置为100%");
  2439. console.log("如果刷新页面或跳转页面则需要再次使用该命令");
  2440. }
  2441.  
  2442. /**
  2443. * 主函数:识别网站,执行对应文档下载策略
  2444. */
  2445. function main() {
  2446. // 显示当前位置
  2447. let host = window.location.host;
  2448. console.log(`当前host: ${host}`);
  2449. // 挂载工具包到全局
  2450. window.user_utils = utils;
  2451. console.log("wk: user_utils已经挂载到全局");
  2452.  
  2453. // 附加任务
  2454. utils.globalFunc(HD); // 全局设置高清图片的函数
  2455.  
  2456. // 主任务
  2457. if (host.includes("docin.com")) {
  2458. docin();
  2459. } else if (host === "ishare.iask.sina.com.cn") {
  2460. ishare();
  2461. } else if (host === "www.deliwenku.com") {
  2462. deliwenku();
  2463. } else if (host === "www.doc88.com") {
  2464. doc88();
  2465. } else if (host === "www.360doc.com") {
  2466. doc360();
  2467. } else if (host === "wenku.baidu.com") {
  2468. baiduWenku();
  2469. } else if (host === "doc.mbalib.com") {
  2470. mbalib();
  2471. } else if (host === "www.woc88.com") {
  2472. woc88();
  2473. } else if (host === "www.dugen.com") {
  2474. dugen();
  2475. } else if (host.includes("book118.com")) {
  2476. book118();
  2477. } else {
  2478. console.log("匹配到了无效网页");
  2479. }
  2480. }
  2481.  
  2482. let options = {
  2483. fast_mode: false,
  2484. activation_test: false
  2485. };
  2486. if (options.cli_mode) {
  2487. (() => {
  2488. loadExternalScripts();
  2489. setTimeout(main, 2000);
  2490. return;
  2491. })();
  2492. }
  2493. if (options.activation_test) {
  2494. alert(`Wenku Doc Downloader 已经生效!\n当前网址:\n${window.location.host}`);
  2495. }
  2496. if (options.fast_mode) {
  2497. main();
  2498. } else {
  2499. window.onload = main;
  2500. }
  2501.  
  2502. })();

QingJ © 2025

镜像随时可能失效,请加Q群300939539或关注我们的公众号极客氢云获取最新地址