सवाल क्या HTML फ़ाइल से सभी हाइपरलिंक्स को निकालने का कोई टूल है?


उबंटू में ऐसा करने का कोई तरीका है? मैंने इसे php में पढ़ा है, लेकिन मैं php से बिल्कुल परिचित नहीं हूं।


4
2018-05-29 14:33


मूल




जवाब:


आप उपयोग कर सकते हैं sed इसके लिए, लेकिन यह केवल उन लिंक के लिए काम करेगा जो HTML कोड में एक पंक्ति में हैं।

अद्यतन करें:

लाल लालची regex! ;) यह अब काम करना चाहिए!

sed -i 's|<a[^>]\+>|<a>|g' <the-html-file>


3
2018-05-29 14:49



यह अजीब व्यवहार कर रहा है! अगले लिंक एंकर तक अनुच्छेद में एक लिंक एंकर के बाद, सभी वाक्यों को हटाया जा रहा है, जिसे हटाया नहीं जा रहा है। जैसा कि कई लिंक छोड़ रहा है। :( - 22lk94k943 only
क्या आप नमूना फाइल दे सकते हैं? - ortang
जरूर, क्यों नहीं। skydrive.live.com/redir?resid=98CCEEFEF56EFF2A!118 - 22lk94k943 only
मैंने अपना जवाब अपडेट कर लिया है - ortang
अरे नहीं! यह पनीर पर एक चाकू की तरह काम कर रहा है। बहुत बहुत धन्यवाद। यदि आप जवाब में "लालची रेगेक्स" का विवरण जोड़ सकते हैं तो यह अत्यधिक शैक्षिक होगा। - 22lk94k943 only


निर्भर करता है कि आप क्या करने का प्रयास कर रहे हैं:

अगर आपके पास अपनी मशीन पर फाइलों का ढेर है, और आप लिंक को हटाना चाहते हैं, तो एक वीई पर्ल स्क्रिप्ट जैसे कुछ को हटाने के लिए <a ...> ... </a> टैग। आप एक ही तरीके से अन्य टैग (या यहां तक ​​कि सभी टैग) को हटा सकते हैं। सही पैटर्न मिलान विकल्पों के साथ, यह दृष्टिकोण टैग को कई लाइनों में विभाजित कर सकता है। (यह बहुत ही सुरुचिपूर्ण है, लेकिन विवरण इस पोस्ट के मार्जिन में फिट नहीं होंगे)।

यदि आप फ़ायरफ़ॉक्स (या अन्य ब्राउज़र) का उपयोग करके कुछ वेबसर्वर पर फ़ाइलों को ब्राउज़ करने का प्रयास कर रहे हैं, तो कुछ प्रकार की greasemonkey स्क्रिप्ट जो स्वचालित रूप से फ्लाई पर पृष्ठों को संशोधित करती है, उन्हें दिखाने से पहले, जो भी आप चाहते हैं हो सकता है।


1
2018-05-29 14:50