[extractor] Common function _match_valid_url

2024-12-11 14:18:18 +01:00 · 2021-08-19 07:11:24 +05:30 · 2021-08-19 07:11:24 +05:30 · 5ad28e7ffd
commit 5ad28e7ffd
parent f79ec47d71
293 changed files with 389 additions and 541 deletions
--- a/devscripts/make_lazy_extractors.py
+++ b/devscripts/make_lazy_extractors.py
@ -31,8 +31,10 @@
    module_template = f.read()

 module_contents = [
-    module_template + '\n' + getsource(InfoExtractor.suitable) + '\n',
-    'class LazyLoadSearchExtractor(LazyLoadExtractor):\n    pass\n']
+    module_template,
+    getsource(InfoExtractor._match_valid_url),
+    getsource(InfoExtractor.suitable),
+    '\nclass LazyLoadSearchExtractor(LazyLoadExtractor):\n    pass\n']

 ie_template = '''
 class {name}({bases}):
--- a/yt_dlp/extractor/abcnews.py
+++ b/yt_dlp/extractor/abcnews.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .amp import AMPIE
 from .common import InfoExtractor
@ -59,7 +58,7 @@ class AbcNewsVideoIE(AMPIE):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        display_id = mobj.group('display_id')
        video_id = mobj.group('id')
        info_dict = self._extract_feed_info(
--- a/yt_dlp/extractor/abcotvs.py
+++ b/yt_dlp/extractor/abcotvs.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..compat import compat_str
@ -55,7 +54,7 @@ class ABCOTVSIE(InfoExtractor):
    }

    def _real_extract(self, url):
-        site, display_id, video_id = re.match(self._VALID_URL, url).groups()
+        site, display_id, video_id = self._match_valid_url(url).groups()
        display_id = display_id or video_id
        station = self._SITE_MAP[site]

--- a/yt_dlp/extractor/acast.py
+++ b/yt_dlp/extractor/acast.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import (
@ -80,7 +79,7 @@ class ACastIE(ACastBaseIE):
    }]

    def _real_extract(self, url):
-        channel, display_id = re.match(self._VALID_URL, url).groups()
+        channel, display_id = self._match_valid_url(url).groups()
        episode = self._call_api(
            '%s/episodes/%s' % (channel, display_id),
            display_id, {'showInfo': 'true'})
--- a/yt_dlp/extractor/adobetv.py
+++ b/yt_dlp/extractor/adobetv.py
@ -132,7 +132,7 @@ class AdobeTVIE(AdobeTVBaseIE):
    }

    def _real_extract(self, url):
-        language, show_urlname, urlname = re.match(self._VALID_URL, url).groups()
+        language, show_urlname, urlname = self._match_valid_url(url).groups()
        if not language:
            language = 'en'

@ -178,7 +178,7 @@ class AdobeTVShowIE(AdobeTVPlaylistBaseIE):
    _process_data = AdobeTVBaseIE._parse_video_data

    def _real_extract(self, url):
-        language, show_urlname = re.match(self._VALID_URL, url).groups()
+        language, show_urlname = self._match_valid_url(url).groups()
        if not language:
            language = 'en'
        query = {
@ -215,7 +215,7 @@ def _process_data(self, show_data):
            show_data['url'], 'AdobeTVShow', str_or_none(show_data.get('id')))

    def _real_extract(self, url):
-        language, channel_urlname, category_urlname = re.match(self._VALID_URL, url).groups()
+        language, channel_urlname, category_urlname = self._match_valid_url(url).groups()
        if not language:
            language = 'en'
        query = {
--- a/yt_dlp/extractor/adultswim.py
+++ b/yt_dlp/extractor/adultswim.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from .turner import TurnerBaseIE
 from ..utils import (
@ -89,7 +88,7 @@ class AdultSwimIE(TurnerBaseIE):
    }]

    def _real_extract(self, url):
-        show_path, episode_path = re.match(self._VALID_URL, url).groups()
+        show_path, episode_path = self._match_valid_url(url).groups()
        display_id = episode_path or show_path
        query = '''query {
  getShowBySlug(slug:"%s") {
--- a/yt_dlp/extractor/aenetworks.py
+++ b/yt_dlp/extractor/aenetworks.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .theplatform import ThePlatformIE
 from ..utils import (
@ -170,7 +169,7 @@ class AENetworksIE(AENetworksBaseIE):
    }]

    def _real_extract(self, url):
-        domain, canonical = re.match(self._VALID_URL, url).groups()
+        domain, canonical = self._match_valid_url(url).groups()
        return self._extract_aetn_info(domain, 'canonical', '/' + canonical, url)


@ -187,7 +186,7 @@ def _call_api(self, resource, slug, brand, fields):
            }))['data'][resource]

    def _real_extract(self, url):
-        domain, slug = re.match(self._VALID_URL, url).groups()
+        domain, slug = self._match_valid_url(url).groups()
        _, brand = self._DOMAIN_MAP[domain]
        playlist = self._call_api(self._RESOURCE, slug, brand, self._FIELDS)
        base_url = 'http://watch.%s' % domain
@ -309,7 +308,7 @@ class HistoryPlayerIE(AENetworksBaseIE):
    _TESTS = []

    def _real_extract(self, url):
-        domain, video_id = re.match(self._VALID_URL, url).groups()
+        domain, video_id = self._match_valid_url(url).groups()
        return self._extract_aetn_info(domain, 'id', video_id, url)


--- a/yt_dlp/extractor/aljazeera.py
+++ b/yt_dlp/extractor/aljazeera.py
@ -1,7 +1,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from .common import InfoExtractor

@ -32,7 +31,7 @@ class AlJazeeraIE(InfoExtractor):
    BRIGHTCOVE_URL_TEMPLATE = 'http://players.brightcove.net/%s/%s_default/index.html?videoId=%s'

    def _real_extract(self, url):
-        post_type, name = re.match(self._VALID_URL, url).groups()
+        post_type, name = self._match_valid_url(url).groups()
        post_type = {
            'features': 'post',
            'program': 'episode',
--- a/yt_dlp/extractor/alura.py
+++ b/yt_dlp/extractor/alura.py
@ -42,8 +42,7 @@ class AluraIE(InfoExtractor):

    def _real_extract(self, url):

-        video_id = self._match_id(url)
-        course = self._search_regex(self._VALID_URL, url, 'post url', group='course_name')
+        course, video_id = self._match_valid_url(url)
        video_url = self._VIDEO_URL % (course, video_id)

        video_dict = self._download_json(video_url, video_id, 'Searching for videos')
--- a/yt_dlp/extractor/amcnetworks.py
+++ b/yt_dlp/extractor/amcnetworks.py
@ -63,7 +63,7 @@ class AMCNetworksIE(ThePlatformIE):
    }

    def _real_extract(self, url):
-        site, display_id = re.match(self._VALID_URL, url).groups()
+        site, display_id = self._match_valid_url(url).groups()
        requestor_id = self._REQUESTOR_ID_MAP[site]
        page_data = self._download_json(
            'https://content-delivery-gw.svc.ds.amcn.com/api/v2/content/amcn/%s/url/%s'
--- a/yt_dlp/extractor/americastestkitchen.py
+++ b/yt_dlp/extractor/americastestkitchen.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from .common import InfoExtractor
 from ..utils import (
@ -69,7 +68,7 @@ class AmericasTestKitchenIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        resource_type, video_id = re.match(self._VALID_URL, url).groups()
+        resource_type, video_id = self._match_valid_url(url).groups()
        is_episode = resource_type == 'episode'
        if is_episode:
            resource_type = 'episodes'
@ -114,7 +113,7 @@ class AmericasTestKitchenSeasonIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        show_name, season_number = re.match(self._VALID_URL, url).groups()
+        show_name, season_number = self._match_valid_url(url).groups()
        season_number = int(season_number)

        slug = 'atk' if show_name == 'americastestkitchen' else 'cco'
--- a/yt_dlp/extractor/anvato.py
+++ b/yt_dlp/extractor/anvato.py
@ -390,7 +390,7 @@ def _real_extract(self, url):
            'countries': smuggled_data.get('geo_countries'),
        })

-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        access_key, video_id = mobj.group('access_key_or_mcp', 'id')
        if access_key not in self._ANVACK_TABLE:
            access_key = self._MCP_TO_ACCESS_KEY_TABLE.get(
--- a/yt_dlp/extractor/apa.py
+++ b/yt_dlp/extractor/apa.py
@ -42,7 +42,7 @@ def _extract_urls(webpage):
                webpage)]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id, base_url = mobj.group('id', 'base_url')

        webpage = self._download_webpage(
--- a/yt_dlp/extractor/appletrailers.py
+++ b/yt_dlp/extractor/appletrailers.py
@ -94,7 +94,7 @@ class AppleTrailersIE(InfoExtractor):
    _JSON_RE = r'iTunes.playURL\((.*?)\);'

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        movie = mobj.group('movie')
        uploader_id = mobj.group('company')

--- a/yt_dlp/extractor/arcpublishing.py
+++ b/yt_dlp/extractor/arcpublishing.py
@ -86,7 +86,7 @@ def _extract_urls(webpage):
        return entries

    def _real_extract(self, url):
-        org, uuid = re.match(self._VALID_URL, url).groups()
+        org, uuid = self._match_valid_url(url).groups()
        for orgs, tmpl in self._POWA_DEFAULTS:
            if org in orgs:
                base_api_tmpl = tmpl
--- a/yt_dlp/extractor/ard.py
+++ b/yt_dlp/extractor/ard.py
@ -199,7 +199,7 @@ def suitable(cls, url):

    def _real_extract(self, url):
        # determine video id from url
-        m = re.match(self._VALID_URL, url)
+        m = self._match_valid_url(url)

        document_id = None

@ -325,7 +325,7 @@ class ARDIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        display_id = mobj.group('id')

        player_url = mobj.group('mainurl') + '~playerXml.xml'
@ -525,7 +525,7 @@ def _ARD_extract_playlist(self, url, playlist_id, display_id, client, mode):
        return self.playlist_result(entries, playlist_title=display_id)

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('video_id')
        display_id = mobj.group('display_id')
        if display_id:
--- a/yt_dlp/extractor/arkena.py
+++ b/yt_dlp/extractor/arkena.py
@ -63,7 +63,7 @@ def _extract_url(webpage):
            return mobj.group('url')

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')
        account_id = mobj.group('account_id')

--- a/yt_dlp/extractor/arte.py
+++ b/yt_dlp/extractor/arte.py
@ -49,7 +49,7 @@ class ArteTVIE(ArteTVBaseIE):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')
        lang = mobj.group('lang') or mobj.group('lang_2')

@ -227,7 +227,7 @@ class ArteTVPlaylistIE(ArteTVBaseIE):
    }]

    def _real_extract(self, url):
-        lang, playlist_id = re.match(self._VALID_URL, url).groups()
+        lang, playlist_id = self._match_valid_url(url).groups()
        collection = self._download_json(
            '%s/collectionData/%s/%s?source=videos'
            % (self._API_BASE, lang, playlist_id), playlist_id)
--- a/yt_dlp/extractor/asiancrush.py
+++ b/yt_dlp/extractor/asiancrush.py
@ -111,7 +111,7 @@ class AsianCrushIE(AsianCrushBaseIE):
    }]

    def _real_extract(self, url):
-        host, video_id = re.match(self._VALID_URL, url).groups()
+        host, video_id = self._match_valid_url(url).groups()

        if host == 'cocoro.tv':
            webpage = self._download_webpage(url, video_id)
@ -161,7 +161,7 @@ def _fetch_page(self, domain, parent_id, page):
            yield self._parse_video_data(video)

    def _real_extract(self, url):
-        host, playlist_id = re.match(self._VALID_URL, url).groups()
+        host, playlist_id = self._match_valid_url(url).groups()

        if host == 'cocoro.tv':
            webpage = self._download_webpage(url, playlist_id)
--- a/yt_dlp/extractor/atresplayer.py
+++ b/yt_dlp/extractor/atresplayer.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..compat import compat_HTTPError
@ -75,7 +74,7 @@ def _login(self):
        self._request_webpage(target_url, None, 'Following Target URL')

    def _real_extract(self, url):
-        display_id, video_id = re.match(self._VALID_URL, url).groups()
+        display_id, video_id = self._match_valid_url(url).groups()

        try:
            episode = self._download_json(
--- a/yt_dlp/extractor/audius.py
+++ b/yt_dlp/extractor/audius.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import random
-import re

 from .common import InfoExtractor
 from ..utils import ExtractorError, try_get, compat_str, str_or_none
@ -124,7 +123,7 @@ class AudiusIE(AudiusBaseIE):
    }

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        track_id = try_get(mobj, lambda x: x.group('track_id'))
        if track_id is None:
            title = mobj.group('title')
@ -217,7 +216,7 @@ def _build_playlist(self, tracks):

    def _real_extract(self, url):
        self._select_api_base()
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        title = mobj.group('title')
        # uploader = mobj.group('uploader')
        url = self._prepare_url(url, title)
--- a/yt_dlp/extractor/awaan.py
+++ b/yt_dlp/extractor/awaan.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re
 import base64

 from .common import InfoExtractor
@ -22,7 +21,7 @@ class AWAANIE(InfoExtractor):
    _VALID_URL = r'https?://(?:www\.)?(?:awaan|dcndigital)\.ae/(?:#/)?show/(?P<show_id>\d+)/[^/]+(?:/(?P<id>\d+)/(?P<season_id>\d+))?'

    def _real_extract(self, url):
-        show_id, video_id, season_id = re.match(self._VALID_URL, url).groups()
+        show_id, video_id, season_id = self._match_valid_url(url).groups()
        if video_id and int(video_id) > 0:
            return self.url_result(
                'http://awaan.ae/media/%s' % video_id, 'AWAANVideo')
@ -154,7 +153,7 @@ class AWAANSeasonIE(InfoExtractor):

    def _real_extract(self, url):
        url, smuggled_data = unsmuggle_url(url, {})
-        show_id, season_id = re.match(self._VALID_URL, url).groups()
+        show_id, season_id = self._match_valid_url(url).groups()

        data = {}
        if season_id:
--- a/yt_dlp/extractor/azmedien.py
+++ b/yt_dlp/extractor/azmedien.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from .common import InfoExtractor
 from .kaltura import KalturaIE
@ -51,7 +50,7 @@ class AZMedienIE(InfoExtractor):
    _PARTNER_ID = '1719221'

    def _real_extract(self, url):
-        host, display_id, article_id, entry_id = re.match(self._VALID_URL, url).groups()
+        host, display_id, article_id, entry_id = self._match_valid_url(url).groups()

        if not entry_id:
            entry_id = self._download_json(
--- a/yt_dlp/extractor/baidu.py
+++ b/yt_dlp/extractor/baidu.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import unescapeHTML
@ -33,7 +32,7 @@ def _call_api(self, path, category, playlist_id, note):
            path, category, playlist_id), playlist_id, note)

    def _real_extract(self, url):
-        category, playlist_id = re.match(self._VALID_URL, url).groups()
+        category, playlist_id = self._match_valid_url(url).groups()
        if category == 'show':
            category = 'tvshow'
        if category == 'tv':
--- a/yt_dlp/extractor/bandcamp.py
+++ b/yt_dlp/extractor/bandcamp.py
@ -294,7 +294,7 @@ def suitable(cls, url):
                else super(BandcampAlbumIE, cls).suitable(url))

    def _real_extract(self, url):
-        uploader_id, album_id = re.match(self._VALID_URL, url).groups()
+        uploader_id, album_id = self._match_valid_url(url).groups()
        playlist_id = album_id or uploader_id
        webpage = self._download_webpage(url, playlist_id)
        tralbum = self._extract_data_attr(webpage, playlist_id)
--- a/yt_dlp/extractor/beatport.py
+++ b/yt_dlp/extractor/beatport.py
@ -40,7 +40,7 @@ class BeatportIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        track_id = mobj.group('id')
        display_id = mobj.group('display_id')

--- a/yt_dlp/extractor/behindkink.py
+++ b/yt_dlp/extractor/behindkink.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import url_basename
@ -24,7 +23,7 @@ class BehindKinkIE(InfoExtractor):
    }

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        display_id = mobj.group('id')

        webpage = self._download_webpage(url, display_id)
--- a/yt_dlp/extractor/bellmedia.py
+++ b/yt_dlp/extractor/bellmedia.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor

@ -78,7 +77,7 @@ class BellMediaIE(InfoExtractor):
    }

    def _real_extract(self, url):
-        domain, video_id = re.match(self._VALID_URL, url).groups()
+        domain, video_id = self._match_valid_url(url).groups()
        domain = domain.split('.')[0]
        return {
            '_type': 'url_transparent',
--- a/yt_dlp/extractor/bilibili.py
+++ b/yt_dlp/extractor/bilibili.py
@ -144,7 +144,7 @@ def _report_error(self, result):
    def _real_extract(self, url):
        url, smuggled_data = unsmuggle_url(url, {})

-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id_bv') or mobj.group('id')

        av_id, bv_id = self._get_video_id_set(video_id, mobj.group('id_bv') is not None)
--- a/yt_dlp/extractor/blackboardcollaborate.py
+++ b/yt_dlp/extractor/blackboardcollaborate.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import parse_iso8601
@ -48,7 +47,7 @@ class BlackboardCollaborateIE(InfoExtractor):
    ]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        region = mobj.group('region')
        video_id = mobj.group('id')
        info = self._download_json(
--- a/yt_dlp/extractor/bokecc.py
+++ b/yt_dlp/extractor/bokecc.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..compat import compat_parse_qs
@ -45,7 +44,7 @@ class BokeCCIE(BokeCCBaseIE):
    }]

    def _real_extract(self, url):
-        qs = compat_parse_qs(re.match(self._VALID_URL, url).group('query'))
+        qs = compat_parse_qs(self._match_valid_url(url).group('query'))
        if not qs.get('vid') or not qs.get('uid'):
            raise ExtractorError('Invalid URL', expected=True)

--- a/yt_dlp/extractor/bongacams.py
+++ b/yt_dlp/extractor/bongacams.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..compat import compat_str
@ -22,7 +21,7 @@ class BongaCamsIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        host = mobj.group('host')
        channel_id = mobj.group('id')

--- a/yt_dlp/extractor/box.py
+++ b/yt_dlp/extractor/box.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from .common import InfoExtractor
 from ..utils import (
@ -30,7 +29,7 @@ class BoxIE(InfoExtractor):
    }

    def _real_extract(self, url):
-        shared_name, file_id = re.match(self._VALID_URL, url).groups()
+        shared_name, file_id = self._match_valid_url(url).groups()
        webpage = self._download_webpage(url, file_id)
        request_token = self._parse_json(self._search_regex(
            r'Box\.config\s*=\s*({.+?});', webpage,
--- a/yt_dlp/extractor/br.py
+++ b/yt_dlp/extractor/br.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from .common import InfoExtractor
 from ..utils import (
@ -86,7 +85,7 @@ class BRIE(InfoExtractor):
    ]

    def _real_extract(self, url):
-        base_url, display_id = re.search(self._VALID_URL, url).groups()
+        base_url, display_id = self._match_valid_url(url).groups()
        page = self._download_webpage(url, display_id)
        xml_url = self._search_regex(
            r"return BRavFramework\.register\(BRavFramework\('avPlayer_(?:[a-f0-9-]{36})'\)\.setup\({dataURL:'(/(?:[a-z0-9\-]+/)+[a-z0-9/~_.-]+)'}\)\);", page, 'XMLURL')
--- a/yt_dlp/extractor/bravotv.py
+++ b/yt_dlp/extractor/bravotv.py
@ -42,7 +42,7 @@ class BravoTVIE(AdobePassIE):
    }]

    def _real_extract(self, url):
-        site, display_id = re.match(self._VALID_URL, url).groups()
+        site, display_id = self._match_valid_url(url).groups()
        webpage = self._download_webpage(url, display_id)
        settings = self._parse_json(self._search_regex(
            r'<script[^>]+data-drupal-selector="drupal-settings-json"[^>]*>({.+?})</script>', webpage, 'drupal settings'),
--- a/yt_dlp/extractor/breakcom.py
+++ b/yt_dlp/extractor/breakcom.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from .youtube import YoutubeIE
@ -41,7 +40,7 @@ class BreakIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        display_id, video_id = re.match(self._VALID_URL, url).groups()
+        display_id, video_id = self._match_valid_url(url).groups()

        webpage = self._download_webpage(url, display_id)

--- a/yt_dlp/extractor/brightcove.py
+++ b/yt_dlp/extractor/brightcove.py
@ -290,7 +290,7 @@ def _real_extract(self, url):
        url = re.sub(r'(?<=[?&])(videoI(d|D)|idVideo|bctid)', '%40videoPlayer', url)
        # Change bckey (used by bcove.me urls) to playerKey
        url = re.sub(r'(?<=[?&])bckey', 'playerKey', url)
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        query_str = mobj.group('query')
        query = compat_urlparse.parse_qs(query_str)

@ -595,7 +595,7 @@ def _real_extract(self, url):
            'ip_blocks': smuggled_data.get('geo_ip_blocks'),
        })

-        account_id, player_id, embed, content_type, video_id = re.match(self._VALID_URL, url).groups()
+        account_id, player_id, embed, content_type, video_id = self._match_valid_url(url).groups()

        policy_key_id = '%s_%s' % (account_id, player_id)
        policy_key = self._downloader.cache.load('brightcove', policy_key_id)
--- a/yt_dlp/extractor/byutv.py
+++ b/yt_dlp/extractor/byutv.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import (
@ -52,7 +51,7 @@ class BYUtvIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')
        display_id = mobj.group('display_id') or video_id

--- a/yt_dlp/extractor/c56.py
+++ b/yt_dlp/extractor/c56.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import js_to_json
@ -31,7 +30,7 @@ class C56IE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url, flags=re.VERBOSE)
+        mobj = self._match_valid_url(url)
        text_id = mobj.group('textid')

        webpage = self._download_webpage(url, text_id)
--- a/yt_dlp/extractor/canalplus.py
+++ b/yt_dlp/extractor/canalplus.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import (
@ -50,7 +49,7 @@ class CanalplusIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        site, display_id, video_id = re.match(self._VALID_URL, url).groups()
+        site, display_id, video_id = self._match_valid_url(url).groups()

        site_id = self._SITE_ID_MAP[site]

--- a/yt_dlp/extractor/canvas.py
+++ b/yt_dlp/extractor/canvas.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from .gigya import GigyaBaseIE
@ -47,7 +46,7 @@ class CanvasIE(InfoExtractor):
    _REST_API_BASE = 'https://media-services-public.vrt.be/vualto-video-aggregator-web/rest/external/v1'

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        site_id, video_id = mobj.group('site_id'), mobj.group('id')

        data = None
@ -192,7 +191,7 @@ class CanvasEenIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        site_id, display_id = mobj.group('site_id'), mobj.group('id')

        webpage = self._download_webpage(url, display_id)
--- a/yt_dlp/extractor/cbsinteractive.py
+++ b/yt_dlp/extractor/cbsinteractive.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .cbs import CBSIE
 from ..utils import int_or_none
@ -71,7 +70,7 @@ class CBSInteractiveIE(CBSIE):
    }

    def _real_extract(self, url):
-        site, display_id = re.match(self._VALID_URL, url).groups()
+        site, display_id = self._match_valid_url(url).groups()
        webpage = self._download_webpage(url, display_id)

        data_json = self._html_search_regex(
--- a/yt_dlp/extractor/cbssports.py
+++ b/yt_dlp/extractor/cbssports.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re

 # from .cbs import CBSBaseIE
 from .common import InfoExtractor
@ -30,7 +29,7 @@ class CBSSportsEmbedIE(InfoExtractor):
    #     return self._extract_feed_info('dJ5BDC', 'VxxJg8Ymh8sE', filter_query, video_id)

    def _real_extract(self, url):
-        uuid, pcid = re.match(self._VALID_URL, url).groups()
+        uuid, pcid = self._match_valid_url(url).groups()
        query = {'id': uuid} if uuid else {'pcid': pcid}
        video = self._download_json(
            'https://www.cbssports.com/api/content/video/',
--- a/yt_dlp/extractor/ccma.py
+++ b/yt_dlp/extractor/ccma.py
@ -3,7 +3,6 @@

 import calendar
 import datetime
-import re

 from .common import InfoExtractor
 from ..utils import (
@ -61,7 +60,7 @@ class CCMAIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        media_type, media_id = re.match(self._VALID_URL, url).groups()
+        media_type, media_id = self._match_valid_url(url).groups()

        media = self._download_json(
            'http://dinamics.ccma.cat/pvideo/media.jsp', media_id, query={
--- a/yt_dlp/extractor/channel9.py
+++ b/yt_dlp/extractor/channel9.py
@ -96,7 +96,7 @@ def _extract_list(self, video_id, rss_url=None):
        return self.playlist_result(entries, video_id, title_text)

    def _real_extract(self, url):
-        content_path, rss = re.match(self._VALID_URL, url).groups()
+        content_path, rss = self._match_valid_url(url).groups()

        if rss:
            return self._extract_list(content_path, url)
--- a/yt_dlp/extractor/chilloutzone.py
+++ b/yt_dlp/extractor/chilloutzone.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re
 import json

 from .common import InfoExtractor
@ -51,7 +50,7 @@ class ChilloutzoneIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')

        webpage = self._download_webpage(url, video_id)
--- a/yt_dlp/extractor/cinemax.py
+++ b/yt_dlp/extractor/cinemax.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .hbo import HBOBaseIE

@ -23,7 +22,7 @@ class CinemaxIE(HBOBaseIE):
    }]

    def _real_extract(self, url):
-        path, video_id = re.match(self._VALID_URL, url).groups()
+        path, video_id = self._match_valid_url(url).groups()
        info = self._extract_info('https://www.cinemax.com/%s.xml' % path, video_id)
        info['id'] = video_id
        return info
--- a/yt_dlp/extractor/cjsw.py
+++ b/yt_dlp/extractor/cjsw.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import (
@ -30,7 +29,7 @@ class CJSWIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        program, episode_id = mobj.group('program', 'id')
        audio_id = '%s/%s' % (program, episode_id)

--- a/yt_dlp/extractor/cnbc.py
+++ b/yt_dlp/extractor/cnbc.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import smuggle_url
@ -57,7 +56,7 @@ class CNBCVideoIE(InfoExtractor):
    }

    def _real_extract(self, url):
-        path, display_id = re.match(self._VALID_URL, url).groups()
+        path, display_id = self._match_valid_url(url).groups()
        video_id = self._download_json(
            'https://webql-redesign.cnbcfm.com/graphql', display_id, query={
                'query': '''{
--- a/yt_dlp/extractor/cnn.py
+++ b/yt_dlp/extractor/cnn.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from .turner import TurnerBaseIE
@ -88,7 +87,7 @@ def _extract_timestamp(self, video_data):
        return None

    def _real_extract(self, url):
-        sub_domain, path, page_title = re.match(self._VALID_URL, url).groups()
+        sub_domain, path, page_title = self._match_valid_url(url).groups()
        if sub_domain not in ('money', 'edition'):
            sub_domain = 'edition'
        config = self._CONFIG[sub_domain]
--- a/yt_dlp/extractor/common.py
+++ b/yt_dlp/extractor/common.py
@ -447,23 +447,22 @@ def __init__(self, downloader=None):
        self.set_downloader(downloader)

    @classmethod
-    def suitable(cls, url):
-        """Receives a URL and returns True if suitable for this IE."""
-
+    def _match_valid_url(cls, url):
        # This does not use has/getattr intentionally - we want to know whether
        # we have cached the regexp for *this* class, whereas getattr would also
        # match the superclass
        if '_VALID_URL_RE' not in cls.__dict__:
            cls._VALID_URL_RE = re.compile(cls._VALID_URL)
-        return cls._VALID_URL_RE.match(url) is not None
+        return cls._VALID_URL_RE.match(url)
+
+    @classmethod
+    def suitable(cls, url):
+        """Receives a URL and returns True if suitable for this IE."""
+        return cls._match_valid_url(url) is not None

    @classmethod
    def _match_id(cls, url):
-        if '_VALID_URL_RE' not in cls.__dict__:
-            cls._VALID_URL_RE = re.compile(cls._VALID_URL)
-        m = cls._VALID_URL_RE.match(url)
-        assert m
-        return compat_str(m.group('id'))
+        return cls._match_valid_url(url).group('id')

    @classmethod
    def working(cls):
--- a/yt_dlp/extractor/commonprotocols.py
+++ b/yt_dlp/extractor/commonprotocols.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..compat import (
@ -72,4 +71,4 @@ class ViewSourceIE(InfoExtractor):
    }

    def _real_extract(self, url):
-        return self.url_result(re.match(self._VALID_URL, url).group('url'))
+        return self.url_result(self._match_valid_url(url).group('url'))
--- a/yt_dlp/extractor/condenast.py
+++ b/yt_dlp/extractor/condenast.py
@ -222,7 +222,7 @@ def _extract_video(self, params):
        }

    def _real_extract(self, url):
-        video_id, player_id, target, url_type, display_id = re.match(self._VALID_URL, url).groups()
+        video_id, player_id, target, url_type, display_id = self._match_valid_url(url).groups()

        if video_id:
            return self._extract_video({
--- a/yt_dlp/extractor/corus.py
+++ b/yt_dlp/extractor/corus.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .theplatform import ThePlatformFeedIE
 from ..utils import (
@ -96,7 +95,7 @@ class CorusIE(ThePlatformFeedIE):
    }

    def _real_extract(self, url):
-        domain, video_id = re.match(self._VALID_URL, url).groups()
+        domain, video_id = self._match_valid_url(url).groups()
        site = domain.split('.')[0]
        path = self._SITE_MAP.get(site, site)
        if path != 'series':
--- a/yt_dlp/extractor/crunchyroll.py
+++ b/yt_dlp/extractor/crunchyroll.py
@ -413,7 +413,7 @@ def _get_subtitles(self, video_id, webpage):
        return subtitles

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')

        if mobj.group('prefix') == 'm':
--- a/yt_dlp/extractor/cultureunplugged.py
+++ b/yt_dlp/extractor/cultureunplugged.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re
 import time

 from .common import InfoExtractor
@ -32,7 +31,7 @@ class CultureUnpluggedIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')
        display_id = mobj.group('display_id') or video_id

--- a/yt_dlp/extractor/dailymotion.py
+++ b/yt_dlp/extractor/dailymotion.py
@ -204,7 +204,7 @@ def _extract_urls(webpage):
        return urls

    def _real_extract(self, url):
-        video_id, playlist_id = re.match(self._VALID_URL, url).groups()
+        video_id, playlist_id = self._match_valid_url(url).groups()

        if playlist_id:
            if not self.get_param('noplaylist'):
--- a/yt_dlp/extractor/dbtv.py
+++ b/yt_dlp/extractor/dbtv.py
@ -38,7 +38,7 @@ def _extract_urls(webpage):
            webpage)]

    def _real_extract(self, url):
-        display_id, video_id = re.match(self._VALID_URL, url).groups()
+        display_id, video_id = self._match_valid_url(url).groups()
        info = {
            '_type': 'url_transparent',
            'id': video_id,
--- a/yt_dlp/extractor/deezer.py
+++ b/yt_dlp/extractor/deezer.py
@ -1,7 +1,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from .common import InfoExtractor
 from ..utils import (
@ -16,7 +15,7 @@ def get_data(self, url):
        if not self.get_param('test'):
            self.report_warning('For now, this extractor only supports the 30 second previews. Patches welcome!')

-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        data_id = mobj.group('id')

        webpage = self._download_webpage(url, data_id)
--- a/yt_dlp/extractor/dfb.py
+++ b/yt_dlp/extractor/dfb.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import unified_strdate
@ -23,7 +22,7 @@ class DFBIE(InfoExtractor):
    }

    def _real_extract(self, url):
-        display_id, video_id = re.match(self._VALID_URL, url).groups()
+        display_id, video_id = self._match_valid_url(url).groups()

        player_info = self._download_xml(
            'http://tv.dfb.de/server/hd_video.php?play=%s' % video_id,
--- a/yt_dlp/extractor/digiteka.py
+++ b/yt_dlp/extractor/digiteka.py
@ -70,7 +70,7 @@ def _extract_url(webpage):
            return mobj.group('url')

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')
        video_type = mobj.group('embed_type') or mobj.group('site_type')
        if video_type == 'music':
--- a/yt_dlp/extractor/discovery.py
+++ b/yt_dlp/extractor/discovery.py
@ -1,7 +1,6 @@
 from __future__ import unicode_literals

 import random
-import re
 import string

 from .discoverygo import DiscoveryGoBaseIE
@ -62,7 +61,7 @@ class DiscoveryIE(DiscoveryGoBaseIE):
    _API_BASE_URL = 'https://api.discovery.com/v1/'

    def _real_extract(self, url):
-        site, show_slug, display_id = re.match(self._VALID_URL, url).groups()
+        site, show_slug, display_id = self._match_valid_url(url).groups()

        access_token = None
        cookies = self._get_cookies(url)
--- a/yt_dlp/extractor/discoverynetworks.py
+++ b/yt_dlp/extractor/discoverynetworks.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .dplay import DPlayIE

@ -35,7 +34,7 @@ class DiscoveryNetworksDeIE(DPlayIE):
    }]

    def _real_extract(self, url):
-        domain, programme, alternate_id = re.match(self._VALID_URL, url).groups()
+        domain, programme, alternate_id = self._match_valid_url(url).groups()
        country = 'GB' if domain == 'dplay.co.uk' else 'DE'
        realm = 'questuk' if country == 'GB' else domain.replace('.', '')
        return self._get_disco_api_info(
--- a/yt_dlp/extractor/discoveryplusindia.py
+++ b/yt_dlp/extractor/discoveryplusindia.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from ..compat import compat_str
 from ..utils import try_get
@ -95,5 +94,5 @@ def _entries(self, show_name):
                page_num += 1

    def _real_extract(self, url):
-        show_name = re.match(self._VALID_URL, url).group('show_name')
+        show_name = self._match_valid_url(url).group('show_name')
        return self.playlist_result(self._entries(show_name), playlist_id=show_name)
--- a/yt_dlp/extractor/disney.py
+++ b/yt_dlp/extractor/disney.py
@ -77,7 +77,7 @@ class DisneyIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        domain, video_id, display_id = re.match(self._VALID_URL, url).groups()
+        domain, video_id, display_id = self._match_valid_url(url).groups()
        if not video_id:
            webpage = self._download_webpage(url, display_id)
            grill = re.sub(r'"\s*\+\s*"', '', self._search_regex(
--- a/yt_dlp/extractor/dlive.py
+++ b/yt_dlp/extractor/dlive.py
@ -1,7 +1,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from .common import InfoExtractor
 from ..utils import int_or_none
@ -26,7 +25,7 @@ class DLiveVODIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        uploader_id, vod_id = re.match(self._VALID_URL, url).groups()
+        uploader_id, vod_id = self._match_valid_url(url).groups()
        broadcast = self._download_json(
            'https://graphigo.prd.dlive.tv/', vod_id,
            data=json.dumps({'query': '''query {
--- a/yt_dlp/extractor/dplay.py
+++ b/yt_dlp/extractor/dplay.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from .common import InfoExtractor
 from ..compat import compat_HTTPError
@ -287,7 +286,7 @@ def _get_disco_api_info(self, url, display_id, disco_host, realm, country):
        }

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        display_id = mobj.group('id')
        domain = mobj.group('domain').lstrip('www.')
        country = mobj.group('country') or mobj.group('subdomain_country') or mobj.group('plus_country')
--- a/yt_dlp/extractor/drbonanza.py
+++ b/yt_dlp/extractor/drbonanza.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import (
@ -26,7 +25,7 @@ class DRBonanzaIE(InfoExtractor):
    }

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id, display_id = mobj.group('id', 'display_id')

        webpage = self._download_webpage(url, display_id)
--- a/yt_dlp/extractor/dropbox.py
+++ b/yt_dlp/extractor/dropbox.py
@ -26,7 +26,7 @@ class DropboxIE(InfoExtractor):
    ]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')
        fn = compat_urllib_parse_unquote(url_basename(url))
        title = os.path.splitext(fn)[0]
--- a/yt_dlp/extractor/drtuber.py
+++ b/yt_dlp/extractor/drtuber.py
@ -42,7 +42,7 @@ def _extract_urls(webpage):
            webpage)

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')
        display_id = mobj.group('display_id') or video_id

--- a/yt_dlp/extractor/dtube.py
+++ b/yt_dlp/extractor/dtube.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import json
-import re
 from socket import timeout

 from .common import InfoExtractor
@ -32,7 +31,7 @@ class DTubeIE(InfoExtractor):
    }

    def _real_extract(self, url):
-        uploader_id, video_id = re.match(self._VALID_URL, url).groups()
+        uploader_id, video_id = self._match_valid_url(url).groups()
        result = self._download_json('https://api.steemit.com/', video_id, data=json.dumps({
            'jsonrpc': '2.0',
            'method': 'get_content',
--- a/yt_dlp/extractor/duboku.py
+++ b/yt_dlp/extractor/duboku.py
@ -186,7 +186,7 @@ class DubokuPlaylistIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        if mobj is None:
            raise ExtractorError('Invalid URL: %s' % url)
        series_id = mobj.group('id')
--- a/yt_dlp/extractor/eagleplatform.py
+++ b/yt_dlp/extractor/eagleplatform.py
@ -123,7 +123,7 @@ def _get_video_url(self, url_or_request, video_id, note='Downloading JSON metada
    def _real_extract(self, url):
        url, smuggled_data = unsmuggle_url(url, {})

-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        host, video_id = mobj.group('custom_host') or mobj.group('host'), mobj.group('id')

        headers = {}
--- a/yt_dlp/extractor/einthusan.py
+++ b/yt_dlp/extractor/einthusan.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from .common import InfoExtractor
 from ..compat import (
@ -48,7 +47,7 @@ def _decrypt(self, encrypted_data, video_id):
        )).decode('utf-8'), video_id)

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        host = mobj.group('host')
        video_id = mobj.group('id')

--- a/yt_dlp/extractor/eporner.py
+++ b/yt_dlp/extractor/eporner.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import (
@ -51,7 +50,7 @@ class EpornerIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')
        display_id = mobj.group('display_id') or video_id

--- a/yt_dlp/extractor/everyonesmixtape.py
+++ b/yt_dlp/extractor/everyonesmixtape.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import (
@ -36,7 +35,7 @@ class EveryonesMixtapeIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        playlist_id = mobj.group('id')

        pllist_url = 'http://everyonesmixtape.com/mixtape.php?a=getMixes&u=-1&linked=%s&explore=' % playlist_id
--- a/yt_dlp/extractor/fc2.py
+++ b/yt_dlp/extractor/fc2.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import hashlib
-import re

 from .common import InfoExtractor
 from ..compat import (
@ -138,7 +137,7 @@ class FC2EmbedIE(InfoExtractor):
    }

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        query = compat_parse_qs(mobj.group('query'))

        video_id = query['i'][-1]
--- a/yt_dlp/extractor/filmweb.py
+++ b/yt_dlp/extractor/filmweb.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor

@ -22,7 +21,7 @@ class FilmwebIE(InfoExtractor):
    }

    def _real_extract(self, url):
-        article_type, article_id = re.match(self._VALID_URL, url).groups()
+        article_type, article_id = self._match_valid_url(url).groups()
        if article_type == 'filmnytt':
            webpage = self._download_webpage(url, article_id)
            article_id = self._search_regex(r'data-videoid="(\d+)"', webpage, 'article id')
--- a/yt_dlp/extractor/fivetv.py
+++ b/yt_dlp/extractor/fivetv.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import int_or_none
@ -66,7 +65,7 @@ class FiveTVIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id') or mobj.group('path')

        webpage = self._download_webpage(url, video_id)
--- a/yt_dlp/extractor/fourtube.py
+++ b/yt_dlp/extractor/fourtube.py
@ -41,7 +41,7 @@ def _extract_formats(self, url, video_id, media_id, sources):
        return formats

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        kind, video_id, display_id = mobj.group('kind', 'id', 'display_id')

        if kind == 'm' or not display_id:
@ -228,7 +228,7 @@ class PornTubeIE(FourTubeBaseIE):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id, display_id = mobj.group('id', 'display_id')

        webpage = self._download_webpage(url, display_id)
--- a/yt_dlp/extractor/foxnews.py
+++ b/yt_dlp/extractor/foxnews.py
@ -67,7 +67,7 @@ def _extract_urls(webpage):
                webpage)]

    def _real_extract(self, url):
-        host, video_id = re.match(self._VALID_URL, url).groups()
+        host, video_id = self._match_valid_url(url).groups()

        info = self._extract_feed_info(
            'http://%s/v/feed/video/%s.js?template=fox' % (host, video_id))
--- a/yt_dlp/extractor/francetv.py
+++ b/yt_dlp/extractor/francetv.py
@ -2,7 +2,6 @@

 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..compat import (
@ -222,7 +221,7 @@ def sign(manifest_url, manifest_id):
        }

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')
        catalog = mobj.group('catalog')

@ -546,7 +545,7 @@ class FranceTVJeunesseIE(FranceTVBaseInfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        playlist_id = mobj.group('id')

        playlist = self._download_json(
--- a/yt_dlp/extractor/frontendmasters.py
+++ b/yt_dlp/extractor/frontendmasters.py
@ -207,7 +207,7 @@ class FrontendMastersLessonIE(FrontendMastersPageBaseIE):
    }

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        course_name, lesson_name = mobj.group('course_name', 'lesson_name')

        course = self._download_course(course_name, url)
--- a/yt_dlp/extractor/funimation.py
+++ b/yt_dlp/extractor/funimation.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import random
-import re
 import string

 from .common import InfoExtractor
@ -49,7 +48,7 @@ class FunimationPageIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        display_id = mobj.group('id').replace('/', '_')
        if not mobj.group('lang'):
            url = '%s/en/%s' % (mobj.group('origin'), mobj.group('path'))
@ -304,7 +303,7 @@ class FunimationShowIE(FunimationIE):
    }]

    def _real_extract(self, url):
-        base_url, locale, display_id = re.match(self._VALID_URL, url).groups()
+        base_url, locale, display_id = self._match_valid_url(url).groups()

        show_info = self._download_json(
            'https://title-api.prd.funimationsvc.com/v2/shows/%s?region=US&deviceType=web&locale=%s'
--- a/yt_dlp/extractor/funk.py
+++ b/yt_dlp/extractor/funk.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from .nexx import NexxIE
@ -31,7 +30,7 @@ class FunkIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        display_id, nexx_id = re.match(self._VALID_URL, url).groups()
+        display_id, nexx_id = self._match_valid_url(url).groups()
        video = self._download_json(
            'https://www.funk.net/api/v4.0/videos/' + nexx_id, nexx_id)
        return {
--- a/yt_dlp/extractor/gaia.py
+++ b/yt_dlp/extractor/gaia.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..compat import (
@ -76,7 +75,7 @@ def _real_initialize(self):
            self._jwt = auth.get('jwt')

    def _real_extract(self, url):
-        display_id, vtype = re.search(self._VALID_URL, url).groups()
+        display_id, vtype = self._match_valid_url(url).groups()
        node_id = self._download_json(
            'https://brooklyn.gaia.com/pathinfo', display_id, query={
                'path': 'video/' + display_id,
--- a/yt_dlp/extractor/gamestar.py
+++ b/yt_dlp/extractor/gamestar.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import (
@ -34,7 +33,7 @@ class GameStarIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        site = mobj.group('site')
        video_id = mobj.group('id')

--- a/yt_dlp/extractor/gaskrank.py
+++ b/yt_dlp/extractor/gaskrank.py
@ -51,7 +51,7 @@ def _real_extract(self, url):
            webpage, default=None) or self._html_search_meta(
            'title', webpage, fatal=True)

-        categories = [re.match(self._VALID_URL, url).group('categories')]
+        categories = [self._match_valid_url(url).group('categories')]

        mobj = re.search(
            r'Video von:\s*(?P<uploader_id>[^|]*?)\s*\|\s*vom:\s*(?P<upload_date>[0-9][0-9]\.[0-9][0-9]\.[0-9][0-9][0-9][0-9])',
--- a/yt_dlp/extractor/gazeta.py
+++ b/yt_dlp/extractor/gazeta.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor

@ -34,7 +33,7 @@ class GazetaIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)

        display_id = mobj.group('id')
        embed_url = '%s?p=embed' % mobj.group('url')
--- a/yt_dlp/extractor/gdcvault.py
+++ b/yt_dlp/extractor/gdcvault.py
@ -149,7 +149,7 @@ def _login(self, webpage_url, display_id):
        return start_page

    def _real_extract(self, url):
-        video_id, name = re.match(self._VALID_URL, url).groups()
+        video_id, name = self._match_valid_url(url).groups()
        display_id = name or video_id

        webpage_url = 'http://www.gdcvault.com/play/' + video_id
--- a/yt_dlp/extractor/gedidigital.py
+++ b/yt_dlp/extractor/gedidigital.py
@ -143,7 +143,7 @@ def _clean_formats(formats):

    def _real_extract(self, url):
        video_id = self._match_id(url)
-        url = re.match(self._VALID_URL, url).group('url')
+        url = self._match_valid_url(url).group('url')
        webpage = self._download_webpage(url, video_id)
        title = self._html_search_meta(
            ['twitter:title', 'og:title'], webpage, fatal=True)
--- a/yt_dlp/extractor/giantbomb.py
+++ b/yt_dlp/extractor/giantbomb.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re
 import json

 from .common import InfoExtractor
@ -32,7 +31,7 @@ class GiantBombIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')
        display_id = mobj.group('display_id')

--- a/yt_dlp/extractor/go.py
+++ b/yt_dlp/extractor/go.py
@ -161,7 +161,7 @@ def _extract_videos(self, brand, video_id='-1', show_id='-1'):
            display_id)['video']

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        sub_domain = remove_start(remove_end(mobj.group('sub_domain') or '', '.go'), 'www.')
        video_id, display_id = mobj.group('id', 'display_id')
        site_info = self._SITE_INFO.get(sub_domain, {})
--- a/yt_dlp/extractor/godtube.py
+++ b/yt_dlp/extractor/godtube.py
@ -1,6 +1,5 @@
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import (
@ -29,7 +28,7 @@ class GodTubeIE(InfoExtractor):
    ]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')

        config = self._download_xml(
--- a/yt_dlp/extractor/googlepodcasts.py
+++ b/yt_dlp/extractor/googlepodcasts.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from .common import InfoExtractor
 from ..utils import (
@ -56,7 +55,7 @@ class GooglePodcastsIE(GooglePodcastsBaseIE):
    }

    def _real_extract(self, url):
-        b64_feed_url, b64_guid = re.match(self._VALID_URL, url).groups()
+        b64_feed_url, b64_guid = self._match_valid_url(url).groups()
        episode = self._batch_execute(
            'oNjqVe', b64_guid, [b64_feed_url, b64_guid])[1]
        return self._extract_episode(episode)
--- a/yt_dlp/extractor/hearthisat.py
+++ b/yt_dlp/extractor/hearthisat.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..utils import (
@ -48,7 +47,7 @@ class HearThisAtIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        m = re.match(self._VALID_URL, url)
+        m = self._match_valid_url(url)
        display_id = '{artist:s} - {title:s}'.format(**m.groupdict())
        api_url = url.replace('www.', '').replace('hearthis.at', 'api-v2.hearthis.at')
        data_json = self._download_json(api_url, display_id)
--- a/yt_dlp/extractor/hidive.py
+++ b/yt_dlp/extractor/hidive.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals

-import re

 from .common import InfoExtractor
 from ..compat import compat_str
@ -55,7 +54,7 @@ def _real_initialize(self):
            self._LOGIN_URL, None, 'Logging in', data=urlencode_postdata(data))

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        title, key = mobj.group('title', 'key')
        video_id = '%s/%s' % (title, key)

--- a/yt_dlp/extractor/hotstar.py
+++ b/yt_dlp/extractor/hotstar.py
@ -173,7 +173,7 @@ class HotStarIE(HotStarBaseIE):
    }

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('id')
        video_type = mobj.group('type')
        cookies = self._get_cookies(url)
--- a/yt_dlp/extractor/hrti.py
+++ b/yt_dlp/extractor/hrti.py
@ -2,7 +2,6 @@
 from __future__ import unicode_literals

 import json
-import re

 from .common import InfoExtractor
 from ..compat import compat_HTTPError
@ -135,7 +134,7 @@ class HRTiIE(HRTiBaseIE):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        video_id = mobj.group('short_id') or mobj.group('id')
        display_id = mobj.group('display_id') or video_id

@ -191,7 +190,7 @@ class HRTiPlaylistIE(HRTiBaseIE):
    }]

    def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
        category_id = mobj.group('id')
        display_id = mobj.group('display_id') or category_id

--- a/yt_dlp/extractor/hungama.py
+++ b/yt_dlp/extractor/hungama.py
@ -139,9 +139,9 @@ class HungamaAlbumPlaylistIE(InfoExtractor):
    }]

    def _real_extract(self, url):
-        id = self._match_id(url)
-        webpage = self._download_webpage(url, id)
+        video_id = self._match_id(url)
+        webpage = self._download_webpage(url, video_id)
        ptrn = r'<meta[^>]+?property=[\"\']?music:song:url[\"\']?[^>]+?content=[\"\']?([^\"\']+)'
        items = re.findall(ptrn, webpage)
        entries = [self.url_result(item, ie=HungamaSongIE.ie_key()) for item in items]
-        return self.playlist_result(entries, id)
+        return self.playlist_result(entries, video_id)
--- a/Show More
+++ b/Show More