Language Breakdown
Lines of code distribution across 16 owned repositories
T-Shaped Developer
T-shapedDeep in PHP with broad versatility
Collaboration Network
Global Impact visualization
Repos
43
PRs
0
Growth
+18%
Top Collaborators
No collaborator data yet.
Coding Streak
Contribution activity over the past year
wisdom-pan
@wisdom-pan
IntSig
@intsig-textin
Hao Fei
@scofield7419
zswvivi
@zswvivi
Winning Health AI Research
@winninghealth
Top Repositories
该项目是为了使用layoutlmv3针对中文图片训练和推理。 其中主要解决三个问题: 1.数据标准化成可以的训练数据集格式 2.layoutlmv3-base-chinese 分词修改 2.超过512长度的文本切分和滑窗操作
1.搭建自己的在线的chatgpt网站 2.通过自己的网站对用户按量收费 在线体验:http://www.online-gpt5.com/
该项目主要是为了识别图片里面的表格数据,并将表格数据抽取处理,导出成csv的文件。整个项目会使用streamlit进行部署和展示。使用的技术:paddleocr,PPStructure,streamlit
该项目主要是抽取病历文件中的一些关键信息。并将抽取的内容进行streamlit前端的展示。目前支持的文件类型:图片,pdf文件,word文件
该项目通过新闻数据集演示文本分类全流程:数据清洗,模型训练,模型部署和前端展示。使用的模型和工具:pytorch,bert,streamlit
使用Qwen1.5-0.5B-Chat模型进行通用信息抽取任务的微调,旨在: 验证生成式方法相较于抽取式NER的效果; 为新手提供简易的模型微调流程,尽量减少代码量; 大模型训练的数据格式处理。
微调阿里开源的文字检测模型,利用合合识别返回的OCR结果作为初始训练数据,对模型进行优化训练,使其更加适应1万张图片的具体场景,提高文字识别的精度。
微调阿里开源的文字检测模型,利用合合识别返回的OCR结果作为初始训练数据,对模型进行优化训练,使其更加适应1万张图片的具体场景,提高文字区域检测的精度,优化边界框质量,减少漏检和误检。
合合通用文档解析mcp
针对图片敏感信息进行涂鸦打码
Open Source Impact
Contributions to external projects
No external contributions found.