首页
/ 正文

Python 判断两个字符串是否由相同的字符组成（千字长文）

更新时间: 2025-04-14 04:01:57

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战(已更新的所有项目都能学习) / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新开坑项目:《Spring AI 项目实战》 正在持续爆肝中，基于 Spring AI + Spring Boot 3.x + JDK 21...， 点击查看 ;

《从零手撸：仿小红书（微服务架构）》 已完结，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 100w+ 字，讲解图 4013+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3700+ 小伙伴加入学习，欢迎点击围观

什么是“由相同字符组成”？

在编程领域，判断两个字符串是否由相同的字符组成，类似于检查两组字母拼图是否能拼出完全相同的图案。例如，字符串 "listen" 和 "silent" 就是由相同的字符重新排列而成，尽管顺序不同。这一问题看似简单，但实际应用中需要考虑字符的重复次数、大小写敏感性、特殊符号处理等细节。本文将通过循序渐进的方式，结合实例和代码，深入讲解 Python 中实现这一功能的多种方法。

方法一：排序法（Sorted Function）

基本原理

将两个字符串分别排序后，若结果完全一致，则说明它们的字符组成相同。这一方法如同将两组字母卡片按字母顺序排列，若最终序列完全重合，则证明原始材料相同。

代码实现

def are_anagrams(str1, str2):
    return sorted(str1) == sorted(str2)

print(are_anagrams("listen", "silent"))  # True
print(are_anagrams("Hello", "hello"))    # False（因大小写不同）

注意事项

大小写敏感：默认情况下，排序会区分大小写（如 'A' 和 'a' 视为不同字符）。
空格和特殊符号：若字符串包含空格或标点符号，需先进行预处理（如去除空格或统一符号格式）。

方法二：字符计数法（Dictionary）

基本原理

通过统计每个字符出现的次数，比较两个字符串的计数结果是否完全一致。这类似于清点两袋糖果的种类和数量是否相同。

代码实现

def count_characters(str1, str2):
    count1 = {}
    count2 = {}
    
    for char in str1:
        count1[char] = count1.get(char, 0) + 1
    for char in str2:
        count2[char] = count2.get(char, 0) + 1
    
    return count1 == count2

print(count_characters("apple", "lepap"))  # True
print(count_characters("test", "tset"))    # True

优势对比

方法	时间复杂度	空间复杂度	是否考虑重复字符
排序法	O(n log n)	O(n)	是
字符计数法	O(n)	O(n)	是

方法三：进阶工具：collections.Counter

引入内置模块

Python 的 collections.Counter 类专门用于统计可哈希对象的出现次数，简化了字符计数的步骤。

代码实现

from collections import Counter

def check_with_counter(str1, str2):
    return Counter(str1) == Counter(str2)

print(check_with_counter("abc", "cba"))  # True
print(check_with_counter("aabb", "abba"))  # True

性能分析

时间复杂度：O(n)，与方法二相同。
代码简洁性：利用现成工具，减少手动编写计数逻辑的错误。

深入探讨：常见误区与解决方案

误区一：忽略大小写差异

print(are_anagrams("Python", "python"))  # False

def case_insensitive_check(str1, str2):
    return sorted(str1.lower()) == sorted(str2.lower())

print(case_insensitive_check("Python", "python"))  # True

误区二：未考虑空格和特殊字符

def process_special_characters(str1, str2):
    # 去除空格并转为小写
    str1_clean = str1.replace(" ", "").lower()
    str2_clean = str2.replace(" ", "").lower()
    return sorted(str1_clean) == sorted(str2_clean)

print(process_special_characters("Hello World", "world hello"))  # True

误区三：重复字符的误判

def incorrect_method(str1, str2):
    return set(str1) == set(str2)

print(incorrect_method("aab", "abb"))  # True（实际应为 False）

性能优化与选择建议

时间复杂度对比

方法	最佳场景
排序法	短字符串或对内存敏感的场景
Counter/字典计数	长字符串或需要精确计数的场景

实际测试案例

import timeit

setup_code = """
from collections import Counter
def sorted_method(a, b):
    return sorted(a) == sorted(b)
def counter_method(a, b):
    return Counter(a) == Counter(b)
"""

print("Short string:")
print("Sorted:", min(timeit.repeat("sorted_method('abcdefghij', 'jihgfedcba')", setup=setup_code, number=10000)))
print("Counter:", min(timeit.repeat("counter_method('abcdefghij', 'jihgfedcba')", setup=setup_code, number=10000)))

long_str = "a" * 500 + "b" * 500
print("\nLong string:")
print("Sorted:", min(timeit.repeat(f"sorted_method('{long_str}', '{long_str[::-1]}')", setup=setup_code, number=100)))
print("Counter:", min(timeit.repeat(f"counter_method('{long_str}', '{long_str[::-1]}')", setup=setup_code, number=100)))

测试结果分析

短字符串：排序法因无需额外空间开销，可能略快于 Counter。
长字符串：Counter 的线性时间复杂度优势明显，性能更优。

扩展应用：实际问题中的变形

场景一：文件内容一致性校验

def compare_files(file1_path, file2_path):
    with open(file1_path, 'r') as f1, open(file2_path, 'r') as f2:
        content1 = f1.read().replace(" ", "").lower()
        content2 = f2.read().replace(" ", "").lower()
        return Counter(content1) == Counter(content2)

场景二：密码强度分析

def check_password_strength(password):
    # 确保密码包含至少两种字符类型（字母、数字、符号）
    char_types = set()
    for char in password:
        if char.isalpha():
            char_types.add("letter")
        elif char.isdigit():
            char_types.add("number")
        else:
            char_types.add("symbol")
    return len(char_types) >= 2

总结与建议

通过本文的对比分析，我们可以得出以下结论：

基础场景：推荐直接使用 sorted() 方法，代码简洁且易于理解。
复杂需求：优先选择 collections.Counter，其性能和扩展性更优。
特殊处理：务必在预处理阶段统一大小写、去除空格，并考虑业务场景的特殊符号规则。

掌握这一技能不仅能解决字符串比较问题，还能为后续学习算法（如排列组合、哈希函数）奠定基础。在实际开发中，建议结合具体场景选择最优方案，并通过单元测试确保逻辑的鲁棒性。

Python 判断两个字符串是否由相同的字符组成（千字长文）

什么是“由相同字符组成”？

方法一：排序法（Sorted Function）

基本原理

代码实现

注意事项

方法二：字符计数法（Dictionary）

基本原理

代码实现

优势对比

方法三：进阶工具：collections.Counter

引入内置模块

代码实现

性能分析

深入探讨：常见误区与解决方案

误区一：忽略大小写差异

误区二：未考虑空格和特殊字符

误区三：重复字符的误判

性能优化与选择建议

时间复杂度对比

实际测试案例

测试结果分析

扩展应用：实际问题中的变形

场景一：文件内容一致性校验

场景二：密码强度分析

总结与建议

最新发布

Clion 2026.2 最新激活码，破解版安装教程（亲测至2099年）

GoLand 2026.2 最新激活码，破解版安装教程（亲测至2099年）

PhpStorm 2026.2 最新激活码，破解版安装教程（亲测至2099年）

Webstorm 2026.2 最新激活码，破解版安装教程（亲测至2099年）

DataGrip 2026.2 最新激活码,破解版安装教程（亲测至2099年~）

IDEA 2026.2 最新激活码，破解版安装教程（亲测至2099年）

Clion 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

RubyMine 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

Rider 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）

GoLand 2026.1.4 最新激活码，破解版安装教程（亲测至2099年）