2chAPIProxy icon indicating copy to clipboard operation
2chAPIProxy copied to clipboard

新形式のHTMLへの対応検討

Open onihusube opened this issue 2 years ago • 21 comments

2023/06/14早朝ごろから?

https://egg.5ch.net/test/read.cgi/software/1683972382/だとモダンなページが表示され
https://egg.5ch.net/test/read.cgi/c/software/1683972382/だと従来のページが表示される

現状はとりあえずHTML取得時に下のURLに切り替えて対処しているが、いつまで従来のページがサポートされるか不明なこととすべての板がこの形式に移行しているか(すべてのスレURLで下の形式が有効か)わからないため新しい形式への対応が必要

  • pinkはまだの様子(23/06/18)
  • 過去ログ倉庫に入ってるようなスレは古いまま表示される

onihusube avatar Jun 14 '23 16:06 onihusube

外観

  • エンコーディングはshift-jis
  • 全1500行くらいのhtml
  • まず左のサイドバーの板一覧が並んでて
  • 次に上の設定等のメニューが来てて
  • その後にjavascriptコード内に>>1だけが単独で配置されてて(1429行目あたり?
  • その後に残りのレスがjavascriptコード内に一行で突っ込まれてる(1450行目あたりから?

onihusube avatar Jun 14 '23 17:06 onihusube

>>1が出てくるあたりの様子

    });</script></div><hr></div><div id="thread" class="column thread"><div id="boardname"><a href="https://5ch.net/">トップページ</a><span class="spanner">⇒</span><a href="https://egg.5ch.net/software/">ソフトウェア@2ch掲示板</a><div class="pagestats"><span class="metastats">1002コメント</span><span class="metastats">270KB</span></div></div><div id="threadtitle">2chAPIProxy 22
</div><article id="1" data-date="NG" data-userid="ID:xx+TmTel0" data-id="1" class="clear post"><details open="" class="post-header"><summary><span class="postid">0001</span><span class="postusername"><b><a href="mailto:sage">名無しさん@お腹いっぱい。</a></b></span></summary><span class="date">2023/02/01(水) 14:21:05.37</span><span class="uid">ID:xx+TmTel0</span></details><section class="post-content"> 前スレ <br> 2chAPIProxy 21 <br> <a href="http://egg.5ch.net/test/read.cgi/software/1675221783/">http://egg.5ch.net/test/read.cgi/software/1675221783/</a> </section></article><div id="Leaderboard"><div class="vm-placement" data-id="6478ba56b73b0307804461f8"></div></div><script>window.top.__vm_add = window.top.__vm_add || [];

残りが出てくるあたり

    })(function () {
        var placement = document.createElement("div");
        placement.setAttribute("class", "vm-placement");
        if (window.innerWidth > 1000) {
            //load desktop placement
            placement.setAttribute("data-id", "6478ba56b73b0307804461f8");
        } else {
            //load mobile placement
            placement.setAttribute("data-id", "6478ba89b73b0307804461fb");
        }
        document.querySelector("#Leaderboard").appendChild(placement);
        window.top.__vm_add.push(placement);
    });</script><article id="2" data-date="NG" data-userid="ID:s+6o33Fz0" data-id="2" class="clear post"><details open="" class="post-header"><summary><span class="postid">0002</span><span class="postusername"><b><a href="mailto:sage">名無しさん@お腹いっぱい。</a></b></span></summary><span class="date">2023/02/01(水) 14:33:22.52</span><span class="uid">ID:s+6o33Fz0</span></details><section class="post-content"> 2chAPIProxy21 <br> <a href="https://egg.5ch.net/test/read.cgi/software/1675214096/">https://egg.5ch.net/test/read.cgi/software/1675214096/</a> </section></article><article id="3" data-date="NG" data-userid="ID:dw48UgLG0" 

onihusube avatar Jun 14 '23 17:06 onihusube

1レスの構造

>>1

<article id="1" data-date="NG" data-userid="ID:7vrFofOj0" data-id="1" class="clear post"><details open class="post-header"><summary><span class="postid">0001</span><span class="postusername"><b><a href="mailto:sage">名無しさん@お腹いっぱい。</a></b></span></summary><span class="date">2023/05/13(土) 19:06:22.49</span><span class="uid">ID:7vrFofOj0</span></details><section class="post-content"> 前スレ <br> 2chAPIProxy 22 <br> <a href="https://egg.5ch.net/test/read.cgi/software/1675228865/">https://egg.5ch.net/test/read.cgi/software/1675228865/</a> </section></article>

>>21以降

<article id="3" data-date="NG" data-userid="ID:Nzcn4Kgf0" data-id="3" class="clear post"><details open class="post-header"><summary><span class="postid">0003</span><span class="postusername"><b><a href="mailto:sage">名無しさん@お腹いっぱい。</a></b></span></summary><span class="date">2023/05/13(土) 20:21:15.82</span><span class="uid">ID:Nzcn4Kgf0</span></details><section class="post-content"> こいつどうする <br> <br> 2chAPIProxy 23 <br> <a href="https://egg.5ch.net/test/read.cgi/software/1683969568/">https://egg.5ch.net/test/read.cgi/software/1683969568/</a> </section></article>

1だけ分かれてるだけで違いはないっぽい

整形

<article id="1" data-date="NG" data-userid="ID:7vrFofOj0" data-id="1" class="clear post">
  <details open class="post-header">
    <summary><span class="postid">0001</span><span class="postusername"><b><a href="mailto:sage">名無しさん@お腹いっぱい。</a></b></span></summary><span class="date">2023/05/13(土) 19:06:22.49</span><span class="uid">ID:7vrFofOj0</span></details>
  <section class="post-content"> 前スレ <br> 2chAPIProxy 22 <br> <a href="https://egg.5ch.net/test/read.cgi/software/1675228865/">https://egg.5ch.net/test/read.cgi/software/1675228865/</a> </section>
</article>

凡例(**で括ってる文字列はプレースホルダとする)

<article id="**レス番号**" data-date="NG" data-userid="**id文字列**" data-id="**レス番号**" class="clear post">
  <details open class="post-header">
    <summary><span class="postid">0001</span><span class="postusername"><b><a href="mailto:**メ欄**">**名前欄**</a></b></span></summary><span class="date">**投稿日時**</span><span class="uid">**id文字列**</span></details>
  <section class="post-content"> **本文** </section>
</article>

参考、以前の形式

<div class="post" id="**レス番号**" data-date="NG" data-userid="**id文字列**" data-id="**レス番号**">
  <div class="meta">
    <span class="number">0005</span><span class="name"><b><a href="mailto:**メ欄**">**名前欄**</a></b></span><span class="date">**投稿日時**</span><span class="uid">**id文字列**</span></div>
  <div class="message"><span class="escaped"> **本文** </span></div>
</div><br>

onihusube avatar Jun 15 '23 03:06 onihusube

繧ケ繝ャ繧ソ繧、蜻ィ霎コ

莉雁屓縺ョ

  gtag('config', 'G-7NQT8916KZ');</script><script src="https://hb.vntsm.com/v3/live/ad-manager.min.js" type="text/javascript" data-site-id="64648695b13b6d05092fa914" data-mode="scan" async></script><meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="viewport" content="width=device-width, user-scalable=no, initial-scale=1, maximum-scale=1"><base href="https://egg.5ch.net/software/"><title>?団hAPIProxy ?抵シ?

蠕捺擂

  gtag('config', 'G-7NQT8916KZ');</script><meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="viewport" content="width=device-width, initial-scale=1"><base href="https://egg.5ch.net/software/"><link href="//agree.5ch.net/_guchi/css/header.css" rel="stylesheet" type="text/css"><link href="//agree.5ch.net/_guchi/css/bootstrap.min.css" rel="stylesheet" type="text/css"><link href="//agree.5ch.net/css/_st.css" rel="stylesheet" type="text/css"><script type="text/javascript" src="//potato.5ch.net/js/jquery-1.11.3.min.js"></script><script type="text/javascript" src="//agree.5ch.net/_guchi/js/bootstrap.min.js"></script><script type="text/javascript" src="//assets.5ch.net/main.js"></script><script type="text/javascript" src="//penguin.5ch.net/js/premium.js"></script><title>?団hAPIProxy ?抵シ?

onihusube avatar Jun 15 '23 04:06 onihusube

メ欄が空だとこうなる

<article id="78" data-date="NG" data-userid="ID:SOlB5TFd0" data-id="78" class="clear post">
  <details open class="post-header">
    <summary><span class="postid">0078</span><span class="postusername"><b>名無しさん@お腹いっぱい。</b></span></summary><span class="date">2023/06/02(金) 18:43:38.40</span><span class="uid">ID:SOlB5TFd0</span></details>
  <section class="post-content"> <a href="../test/read.cgi/software/1683972382/77" rel="noopener noreferrer" target="_blank" class="reply_link">&gt;&gt;77</a> <br> 串には内部串と外部串があってな </section>
</article>

つまり<a href="mailto:...">が消える(これは従来と同じ

<span class="postusername"><b><a href="mailto:sage">名無しさん@お腹いっぱい。</a></b></span>
<span class="postusername"><b>名無しさん@お腹いっぱい。</b></span>

その他名前欄バリエーション

<span class="postusername"><b><a href="mailto:agete"> </b>【関電 %】<b> <small>陰性</small></a></b></span>
<span class="postusername"><b>5ちゃんねる ★</b></span>
<span class="postusername"><b>以下、5ちゃんねるからVIPがお送りします </b>(ワッチョイW 596e-MJ2W)<b></b></span>
<span class="postusername"><b>コテハン </b>◆tripstring <b></b></span>
<span class="postusername"><b><a href="mailto:sage">名無しですよ、名無し!</b>(茸)<b> <small></small> </b>(スッップ Sd03-iU77 [49.98.218.88])<b></a></b></span>

onihusube avatar Jun 15 '23 07:06 onihusube

beのある場合

  • https://medaka.5ch.net/test/read.cgi/be/1662372307/
<article id="2" data-date="NG" data-userid="ID:QOxLhn3Q" data-id="2" class="clear post">
  <details open class="post-header">
    <summary><span class="postid">0002</span><span class="postusername"><b>名無しさん@ログイン中</b></span></summary><span class="date">2022/09/05(月) 19:05:55.09</span><span class="uid">ID:QOxLhn3Q</span><span class="be rS★"><a href="http://be.5ch.net/user/676665312" target="_blank">?S★(2770727)</a></span></details>
  <section class="post-content"> <img src="//img.5ch.net/premium/6666924.gif"> <br> テスト </section>
</article>

<article id="15" data-date="NG" data-userid="ID:Jo4mdSOi" data-id="15" class="clear post">
  <details open class="post-header">
    <summary><span class="postid">0015</span><span class="postusername"><b>名無しさん@ログイン中</b></span></summary><span class="date">2022/09/26(月) 15:43:27.31</span><span class="uid">ID:Jo4mdSOi</span><span class="be r2BP"><a href="http://be.5ch.net/user/823355746" target="_blank">?2BP(0)</a></span></details>
  <section class="post-content"> <img src="//img.5ch.net/ico/nida.gif"> <br> てすと </section>
</article>

日付の後のIDの<span>の後ろに、<span class="be ...</span>が入る

今回の
<span class="be rS★"><a href="http://be.5ch.net/user/676665312" target="_blank">?S★(2770727)</a></span>
<span class="be r2BP"><a href="http://be.5ch.net/user/823355746" target="_blank">?2BP(0)</a></span>

従来
<span class="be rS★"><a href="http://be.5ch.net/user/676665312" target="_blank">?S★(2770727)</a></span>
<span class="be r2BP"><a href="http://be.5ch.net/user/823355746" target="_blank">?2BP(0)</a></span>

つまりここは変わらない

本文のアイコンは

今回の
<img src="//img.5ch.net/premium/6666924.gif"> <br> 
<img src="//img.5ch.net/ico/nida.gif"> <br> 

従来
<img src="//img.5ch.net/premium/6666924.gif"> <br>
<img src="//img.5ch.net/ico/nida.gif"> <br>

onihusube avatar Jun 15 '23 08:06 onihusube

krsw鯖、相変わらずおかしい

新しい形式でも、htmlが1行に畳まれている・・・

  • https://krsw.5ch.net

2023/06/20時点では治ってるぽい

onihusube avatar Jun 16 '23 02:06 onihusube

AAを判定すると表示が変わるらしい

  • https://mevius.5ch.net/test/read.cgi/aasaloon/1623264098/
<section class="post-content"><span class="AA">    /:::::::::::::::`&quot;'ヾ''&quot;´``'''&quot;'::::::::::::::ヽ <br>   /:::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::i <br>  i:::::::::::::::::::::::::;;;;;;;;;;;;;;;;;;;;;;;;;;;;:::::::::::::::::::::::i <br>  i:::::::::::::::::::/      o 丶:::::::::::::::::::i <br>  |::::::::::::::::::ミ        0.ミ::::::::::::::::::| <br>  .|::::::::::::::::ミ          ミ::::::::::::::::| <br>   ヾ::::::::::::ミ          .ミ::::::::::::/ <br>    ヾ::::::::/.:iilllllii;;:. .::;;llllllii;;; ヾ::::::丿 <br>     ヾ;;l -=・=-〉 〈 -=・=- j::;/ <br>     ヽ_i   ̄ / l l丶 ̄  i_ノ <br>       l   イ丶  )、 ノ.l <br>        .|   、`^-^´ ,、 l <br>         | ``ニニニ'&quot;  / <br>         ヽ i    i/ <br>           ``‐-‐'´ <br> <br> フッフッフ、私の呪縛は死ぬまで解けないぞ </span></section>

つまり、<span class="AA"> </span>で本文が囲われる

普通のレス本体
<section class="post-content"> **本文** </section>

AAだとみなされた場合
<section class="post-content"><span class="AA"> **本文** </span></section>

古いのも確認したら同じようになってた(元からそうだっけ・・・

onihusube avatar Jun 16 '23 02:06 onihusube

IDなしの場合

  • https://mevius.5ch.net/test/read.cgi/nogizaka/1498977674/
<article id="2" data-date="NG" data-userid data-id="2" class="clear post"><details open class="post-header"><summary><span class="postid">0002</span><span class="postusername"><b>君の名は</b>(地震なし)<b></b></span></summary><span class="date">2017/07/02(日) 15:48:29.15</span><span class="uid"></span></details><section class="post-content"> 2ちゃんでもtwitterでもネットリテラシーが低い人が多いのは感じる </section></article>

<span class="uid">が空になるらしい

<span class="date">2023/05/13(土) 19:06:22.49</span><span class="uid">ID:7vrFofOj0</span>
<span class="date">2017/07/02(日) 15:48:29.15</span><span class="uid"></span>

onihusube avatar Jun 16 '23 02:06 onihusube

p53

  • https://fate.5ch.net/test/read.cgi/idol/1451917252/

新しいの

<article id="18" data-date="NG" data-userid="NG" data-id="18" class="clear post"><details open class="post-header"><summary><span class="postid">0018</span><span class="postusername"><b><a href="mailto:やっとでました">p53 ★</a></b></span></summary><span class="date">NG</span><span class="uid">NG</span></details><section class="post-content">p53 ver 0.16 (Perl,SJIS) 2016/01/04 FOX. [on] <br>元のスレ <a href="http://hope.5ch.net/test/read.cgi/idol/1451917253/1">http://hope.2ch.net/test/read.cgi/idol/1451917253/1</a> <br><b>18422 -> 4827</b> (バイト)<br>p53 このスレは検体(実験台)です。巨大コピペ大歓迎。<br>p53 とは、<a href="http://jump.5ch.net/?http://server.maido3.com/?txt=kirei#top" target="_blank">http://server.maido3.com/?txt=kirei#top</a><br></section></article>

今までの

<div class="post" id="18" data-date="NG" data-userid="NG" data-id="18"><div class="meta"><span class="number">0018</span><span class="name"><b><a href="mailto:やっとでました">p53 ★</a></b></span><span class="date">NG</span><span class="uid">NG</span></div><div class="message"><span class="escaped">p53 ver 0.16 (Perl,SJIS) 2016/01/04 FOX. [on] <br>元のスレ <a href="http://hope.5ch.net/test/read.cgi/idol/1451917253/1">http://hope.2ch.net/test/read.cgi/idol/1451917253/1</a> <br><b>18422 -> 4827</b> (バイト)<br>p53 このスレは検体(実験台)です。巨大コピペ大歓迎。<br>p53 とは、<a href="http://jump.5ch.net/?http://server.maido3.com/?txt=kirei#top" target="_blank">http://server.maido3.com/?txt=kirei#top</a><br></span></div></div><br>

onihusube avatar Jun 16 '23 07:06 onihusube

お絵描き

  • https://agree.5ch.net/test/read.cgi/oekaki/1675428467/
<article id="4" data-date="NG" data-userid="ID:kdW1ZYWK0" data-id="4" class="clear post"><details open class="post-header"><summary><span class="postid">0004</span><span class="postusername"><b><a href="mailto:sage">名無しさん@お絵かき中</a></b></span></summary><span class="date">2023/04/13(木) 22:52:54.44</span><span class="uid">ID:kdW1ZYWK0</span></details><section class="post-content"> <br> <img src="//o.5ch.net/20vzd.png"> </section></article>

本文

<section class="post-content"> <br> <img src="//o.5ch.net/20vzd.png"> </section>

古いの

<div class="message"><span class="escaped"> <br> <img src="//o.5ch.net/20vzd.png"> </span></div></div><br>

datとの対応はこんなかんじ

<section class="post-content"> <br> <img src="//o.5ch.net/20vzd.png"> </section>
<>  <br> sssp://o.5ch.net/20vzd.png <>

ssspリンクに直してimgタグを取るが、先頭の<br>の前にスペースが一個多い。多分本文先頭にお絵描きが来てるときだけ

onihusube avatar Jun 16 '23 07:06 onihusube

安価

<a href="../test/read.cgi/software/1683972382/3" rel="noopener noreferrer" target="_blank" class="reply_link">&gt;&gt;3</a>

古いの

<a href="../test/read.cgi/software/1683972382/3" rel="noopener noreferrer" target="_blank" class="reply_link">&gt;&gt;3</a>

さらに古いの(2016/03)

<a href="../test/read.cgi/software/1458275801/1" target="_blank">&gt;&gt;1</a>

onihusube avatar Jun 16 '23 08:06 onihusube

あぼーん

  • https://mevius.5ch.net/test/read.cgi/antispam/1506140159/
<article id="3" data-date="NG" data-userid="NG" data-id="3" class="clear post"><details open class="post-header"><summary><span class="postid">0003</span><span class="postusername"><b><a href="mailto:あぼーん">あぼーん</a></b></span></summary><span class="date">NG</span><span class="uid">NG</span></details><section class="post-content">あぼーん</section></article>

うふ~ん

  • https://mercury.bbspink.com/test/read.cgi/feet/1528609900/
<div class="post" id="2" data-date="NG" data-userid="NG" data-id="2"><div class="meta"><span class="number">2</span><span class="name"><b><a href="mailto:うふ~ん">うふ~ん</a></b></span><span class="date">NG</span><span class="uid">NG</span></div><div class="message"><span class="escaped">うふ~ん</span></div></div><br>

昔の(API以前からのhtml形式)

<dt>158 :<a href="mailto:あぼ~ん"><b>あぼ~ん</b></a>:あぼ~ん ID:DELETED<dd>あぼ~ん<br><br>
<dt>38 :<a href="mailto:うふ~ん"><b>うふ~ん</b></a>:うふ~ん ID:DELETED<dd>うふ~ん<br><br>

onihusube avatar Jun 16 '23 17:06 onihusube

1つ前の形式のバグ

  • https://medaka.5ch.net/test/read.cgi/c/be/1599094155/377

これが

<div class="post" id="377" data-date="NG" data-userid="NG" data-id="377"><div class="meta"><span class="number">0377</span><span class="name"><b><a href="mailto:あぼーん">あぼーん</a></b></span><span class="date">NG</span><span class="uid">NG</span></div><div class="message"><span class="escaped">あぼーん</span></div></div><br>

こうなる(例えば)

あぼーん<>あぼーん<>2020/09/03(木) 09:49:15.00 ID:NG0<> あぼーん <>

こうなるのが正解のはず

あぼーん<>あぼーん<>あぼーん<>あぼーん<>あぼーん

なにか日付とIDがともにNGの場合に特殊対応しているけど、ID:NG0が一体何だったのかもはや・・・

同スレの下の方にも似たようなやつがある

  • https://medaka.5ch.net/test/read.cgi/c/be/1599094155/949-950

onihusube avatar Jun 20 '23 15:06 onihusube

https://egg.5ch.net/test/read.cgi/software/1683972382/371

なんJ なんGの過去ログ取れないね

onihusube avatar Jun 22 '23 15:06 onihusube

  • https://egg.5ch.net/test/read.cgi/software/1683972382/417-419

2023/06/25 6:45:08 http://egg.5ch.net/test/read.cgi/software/1613504553/1-をHTMLから変換中にエラーが発生しました。 System.Net.WebException: リモート サーバーがエラーを返しました: (308) Permanent Redirect 場所 System.Net.WebClient.OpenRead(Uri address) 場所 _APIぷろ串.HtmlConverter.HtmltoDat.Gethtml(String URI, Int32 range, String UA, Boolean CRReplace, String LastMod) 2023/06/25 6:45:07

下から2行目の名前の部分だけたぶんRock指定されたるから変えたけど 過去ログを取得しようとするとこのエラーが出る 別の板のスレでも同じ 20230621test

現行スレの読み込みは普通にできる 書き込みは以前からできない

HTML変換設定 過去ログをHTMLから変換する、過去ログ倉庫へのアクセスを置換する、Offlaw2/Rokkaへのアクセスを置換する

俺だけ?

AviUtl拡張編集Pluginスレッド Part16 1000まで取得できた

ごめん 過去ログへのリンクを1クリックで、1つだけじゃなくて複数行の同じエラーを同じ時間に出してたわ たぶんエラー出てトライを繰り返しただけだと思うけど一応

onihusube avatar Jun 25 '23 05:06 onihusube

  • https://egg.5ch.net/test/read.cgi/software/1683972382/585

メンヘラ板で恐縮ですが、この2つの過去をスレhtmlで取得できますか? 取得できるスレとできないスレがあって、この2つはできませんでした 専ブラはギコです ttp://mevius.5ch.net/test/read.cgi/utu/1680609358/ ttp://mevius.5ch.net/test/read.cgi/utu/1685826040/

>>585 療法ともできない

>>585 両方できない Xeno220528(20230621 test

HTTP/1.1 302 302 Found

302 Foundで失敗していて、2chAPIProxyのログに何も出てないなら、差分検出に失敗しているっぽい

そこは現状改善の余地がない気がする・・・

onihusube avatar Jul 02 '23 15:07 onihusube

  • https://egg.5ch.net/test/read.cgi/software/1712375061/193

ギコナビVersion バタ70(1.70.1.860)+これver2023.07.13 nonAPI test でdat落ちスレを取得すると

https://i.imgur.com/a0XLT1f.jpg

こんな感じで本文空っぽのスレを取得してしまう、25日の夜辺りから お助け~

onihusube avatar Apr 25 '24 09:04 onihusube

新しい形式

<article id="2" data-date="NG" data-userid="ID:snSCSwWG0" data-id="2" class="clear post">
  <details open class="post-header">
    <summary><span class="postid">0002</span><span class="postusername"><b>名無しさん@お腹いっぱい。</b></span><span style="float:right; max-height: 1em;"><form action="https://donguri.5ch.net/confirm" target="_blank" accept-charset="UTF-8" method="GET"><a href="https://donguri.5ch.net" target="_blank">垢版</a> | <input type="hidden" name="url" value="//egg.5ch.net/test/read.cgi/software/1712375061/"><input type="hidden" name="date" value="2024/04/06(土) 13:03:07.40"><button type="submit" style="border: none; background: none; cursor: pointer; font-size: 1em; color:#9b4dca;">大砲</button></form></span></summary><span style="width:100%;"><span class="date">2024/04/06(土) 13:03:07.40</span><span class="uid">ID:snSCSwWG0</span></span></details>
  <section class="post-content"> <a href="../test/read.cgi/software/1712375061/1" rel="noopener noreferrer" target="_blank" class="reply_link">&gt;&gt;1</a>乙 </section>
</article>

もっとも異なるのは

<summary>
  <span class="postid">0002</span>
  <span class="postusername"><b>名無しさん@お腹いっぱい。</b></span>
  <span style="float:right; max-height: 1em;">
      <form action="https://donguri.5ch.net/confirm" target="_blank" accept-charset="UTF-8" method="GET">
        <a href="https://donguri.5ch.net" target="_blank">垢版</a> | 
        <input type="hidden" name="url" value="//egg.5ch.net/test/read.cgi/software/1712375061/">
        <input type="hidden" name="date" value="2024/04/06(土) 13:03:07.40">
        <button type="submit" style="border: none; background: none; cursor: pointer; font-size: 1em; color:#9b4dca;">大砲</button>
      </form>
  </span>
</summary>
<span style="width:100%;">
<!-- 以下日付IDと本文 -->

どんぐり関連の何かが混入している

onihusube avatar Apr 25 '24 09:04 onihusube

ワッチョイ

<article id="68" data-date="NG" data-userid="ID:YO3B1XQ+r" data-id="68" class="clear post"><details open class="post-header"><summary><span class="postid">0068</span><span class="postusername"><b>番組の途中ですがアフィサイトへの転載は禁止です</b> <span style="color:green;">警備員[Lv.7][新][苗][芽]</span><b> </b>(オッペケ Srea-/G3D)<b></b></span><span style="float:right; max-height: 1em;"><form action="https://donguri.5ch.net/confirm" target="_blank" accept-charset="UTF-8" method="GET"><a href="https://donguri.5ch.net" target="_blank">垢版</a> | <input type="hidden" name="url" value="//greta.5ch.net/test/read.cgi/poverty/1714034581/"><input type="hidden" name="date" value="2024/04/25(木) 17:49:10.45"><button type="submit" style="border: none; background: none; cursor: pointer; font-size: 1em; color:#9b4dca;">大砲</button></form></span></summary><span style="width:100%;"><span class="date">2024/04/25(木) 17:49:10.45</span><span class="uid">ID:YO3B1XQ+r</span></span></details><section class="post-content"> 文明の終焉って感じで感慨深いな <br> 後はメギドの火を待つばかりか </section>

ズームすると

<span class="postusername">
  <b>番組の途中ですがアフィサイトへの転載は禁止です</b> 
  <span style="color:green;">警備員[Lv.7][新][苗][芽]</span>
  <b> </b>(オッペケ Srea-/G3D)<b></b>
</span>
<span style="float:right; max-height: 1em;">
      <form action="https://donguri.5ch.net/confirm" target="_blank" accept-charset="UTF-8" method="GET">
        <a href="https://donguri.5ch.net" target="_blank">垢版</a> | 
        <input type="hidden" name="url" value="//greta.5ch.net/test/read.cgi/poverty/1714034581/">
        <input type="hidden" name="date" value="2024/04/25(木) 17:49:10.45">
        <button type="submit" style="border: none; background: none; cursor: pointer; font-size: 1em; color:#9b4dca;">大砲</button>
      </form>
</span>

be

<article id="71" data-date="NG" data-userid="ID:JroisIg/0" data-id="71" class="clear post"><details open class="post-header"><summary><span class="postid">0071</span><span class="postusername"><b>顔デカ</b> <span style="color:green;">警備員[Lv.12(前19)][苗][芽]</span><b> </b>(ワッチョイW ac0d-89Xz)<b></b></span><span style="float:right; max-height: 1em;"><form action="https://donguri.5ch.net/confirm" target="_blank" accept-charset="UTF-8" method="GET"><a href="https://donguri.5ch.net" target="_blank">垢版</a> | <input type="hidden" name="url" value="//greta.5ch.net/test/read.cgi/poverty/1714034581/"><input type="hidden" name="date" value="2024/04/25(木) 17:49:29.37"><button type="submit" style="border: none; background: none; cursor: pointer; font-size: 1em; color:#9b4dca;">大砲</button></form></span></summary><span style="width:100%;"><span class="date">2024/04/25(木) 17:49:29.37</span><span class="uid">ID:JroisIg/0</span></span><span class="be r2BP"><a href="http://be.5ch.net/user/681125504" target="_blank">?2BP(1000)</a></span></details><section class="post-content"> <img src="//img.5ch.net/ico/nida.gif"> <br> ゆっくりバイデンだぜ! <br> 今日はイスラエルの偉大さを解説するんだぜ! </section>

ズームすると

<span style="width:100%;">
  <span class="date">2024/04/25(木) 17:49:29.37</span>
  <span class="uid">ID:JroisIg/0</span>
</span>
<span class="be r2BP">
  <a href="http://be.5ch.net/user/681125504" target="_blank">?2BP(1000)</a>
</span>
</details><section class="post-content">

onihusube avatar Apr 25 '24 10:04 onihusube

なんかよく分からないけど、古いHTMLを取得して変換可能な場合があるっぽい?(UAもしくは何らかのキャッシュ?)

ローカル環境の2023/06/14のHtmlConverter.dllでなぜか普通に変換できている。なぜ・・・?

多分、/read.cgi/c/の方のURLで取るバージョンを使ってるっぽい。/c/の方だと古い形式が帰ってくる(やたら重いけど)

onihusube avatar Apr 25 '24 10:04 onihusube