开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 2111|回复: 19
收起左侧

[其它源码] 一个可以预测 名字性别的的源码 据说比你猜的还准

[复制链接]
结帖率:30% (6/20)
发表于 2024-7-19 22:24:33 | 显示全部楼层 |阅读模式   江西省九江市
分享源码
界面截图: -
是否带模块: -
备注说明: -
本帖最后由 shituo 于 2024-7-19 22:26 编辑

[C++] 纯文本查看 复制代码
#include <fstream>
#include <sstream>
#include <map>
#include <string>
#include <vector>
#include <iostream>
#include <stdexcept>

class GenderUtils {
public:
    GenderUtils() {
        init();
    }

    std::map<std::string, double> guessGenderByName(const std::string& nameString) {
        std::vector<char> nameChars(nameString.begin() + 1, nameString.end());
        double maleProb = getGenderProb(nameChars, 1);
        double femaleProb = getGenderProb(nameChars, 0);

        if (maleProb > femaleProb) {
            return {{"male", maleProb / (maleProb + femaleProb)}};
        } else if (femaleProb > maleProb) {
            return {{"female", femaleProb / (maleProb + femaleProb)}};
        } else {
            return {{"unknown", 0}};
        }
    }

private:
    std::map<char, std::pair<int, int>> rawGenderMap;
    std::map<char, std::pair<double, double>> genderMap;
    int maleTotal = 0;
    int femaleTotal = 0;
    int genderTotal = 0;

    void init() {
        std::ifstream file("data/ngender/charfreq.csv");
        if (!file.is_open()) {
            throw std::runtime_error("Failed to open file.");
        }
        std::string line;
        std::getline(file, line); // Skip header

        while (std::getline(file, line)) {
            std::istringstream ss(line);
            std::string cell;
            std::getline(ss, cell, ','); // Get first cell
            char nameChar = cell[0];
            std::getline(ss, cell, ','); // Get second cell
            int maleNum = std::stoi(cell);
            std::getline(ss, cell, ','); // Get third cell
            int femaleNum = std::stoi(cell);
            rawGenderMap[nameChar] = {maleNum, femaleNum};
            maleTotal += maleNum;
            femaleTotal += femaleNum;
        }
        genderTotal = maleTotal + femaleTotal;

        // Convert raw counts to probabilities
        for (auto& p : rawGenderMap) {
            genderMap[p.first] = {static_cast<double>(p.second.second) / femaleTotal,
                                  static_cast<double>(p.second.first) / maleTotal};
        }
    }

    double getGenderProb(const std::vector<char>& nameChars, int genderFlag) {
        double baseProb = genderFlag == 0 ? static_cast<double>(femaleTotal) / genderTotal :
                                            static_cast<double>(maleTotal) / genderTotal;

        for (char nameChar : nameChars) {
            auto it = genderMap.find(nameChar);
            if (it != genderMap.end()) {
                baseProb *= it->second[genderFlag];
            }
        }

        return baseProb;
    }
};

int main() {
    try {
        GenderUtils genderUtils;
        auto result = genderUtils.guessGenderByName("张三");
        for (const auto& pair : result) {
            std::cout << pair.first << ": " << pair.second << std::endl;
        }
    } catch (const std::exception& e) {
        std::cerr << "Error: " << e.what() << std::endl;
    }
    return 0;
}

charfreq.zip

40.75 KB, 下载次数: 8, 下载积分: 精币 -2 枚

售价: 5 枚 精币  [记录]

评分

参与人数 3精币 +4 收起 理由
wa690602724 + 1 感谢分享,很给力!~
baitso + 2 支持开源~!感谢分享
多多帅吧 + 1 感谢你的支持,精易有你更精彩

查看全部评分


结帖率:100% (2/2)

签到天数: 13 天

发表于 2024-8-2 09:33:19 | 显示全部楼层   河南省济源市
谢谢分享
回复 支持 反对

使用道具 举报

结帖率:100% (6/6)

签到天数: 17 天

发表于 2024-7-26 00:27:17 | 显示全部楼层   安徽省合肥市
感谢大神分享~!
回复 支持 反对

使用道具 举报

结帖率:0% (0/1)

签到天数: 18 天

发表于 2024-7-25 13:49:15 | 显示全部楼层   广东省汕头市
感谢大神分享~!
回复 支持 反对

使用道具 举报

结帖率:0% (0/1)
发表于 2024-7-21 13:28:54 | 显示全部楼层   河南省焦作市
学习一下啦
回复 支持 反对

使用道具 举报

签到天数: 29 天

发表于 2024-7-20 19:06:46 | 显示全部楼层   广东省广州市
支持开源~!感谢分享
回复 支持 反对

使用道具 举报

结帖率:100% (18/18)

签到天数: 19 天

发表于 2024-7-20 18:51:50 | 显示全部楼层   吉林省辽源市
学习  学习 学习
回复 支持 反对

使用道具 举报

结帖率:0% (0/1)

签到天数: 23 天

发表于 2024-7-20 17:55:46 | 显示全部楼层   江西省上饶市
我是谁,我叫啥。哈哈
回复 支持 反对

使用道具 举报

签到天数: 4 天

发表于 2024-7-20 16:04:36 | 显示全部楼层   广东省惠州市
刚好学到这,东西拿走
回复 支持 反对

使用道具 举报

结帖率:0% (0/2)

签到天数: 25 天

发表于 2024-7-20 14:46:29 | 显示全部楼层   广西壮族自治区玉林市
感谢分享 !
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:wp@125.la
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表