资料库
了解网易伏羲从这里开始
目标检测算法类别和检测模型性能评估指标介绍新闻资讯
对象检测是一项计算机视觉任务,主要是识别和定位图像或视频中的对象。它是许多应用程序的重要组成部分,例如监控、自动驾驶汽车或机器人技术。而根据同一输入图像通过网络的次数,目标检测算法大致分为两类。
2023-01-18 11:28:51
Learn2Sing 2.0: Diffusion and Mutual Information-Based Target Speaker SVS by Learning from Singing Teacher学术论文
论文所提出的方法能够在没有歌声数据的情况下,通过10个解码步骤为目标说话人合成高质量的歌声。
2023-01-18 10:18:55
Opencpop: A High-Quality Open Source Chinese Popular Song Corpus for Singing Voice Synthesis学术论文
论文介绍了 Opencpop,这是一种公开可用的高质量普通话歌唱语料库,专为歌声合成(SVS)而设计。语料库包含100首流行的普通话歌曲,由一位女专业歌手演唱。音频文件以44,100赫兹的采样率以录音室质量录制,并提供相应的歌词和乐谱。
2023-01-18 10:12:59
One-shot Voice Conversion for Style Transfer based on Speaker Adaptation学术论文
在本论文中,我们建立在识别合成框架的基础上,提出了一种基于说话人自适应的风格转换的一次性语音转换方法。
2023-01-18 10:09:25
网易伏羲预训练模型”玉言“登顶CLUE分类榜单,成绩首次超过人类水平
网易伏羲预训练模型”玉言“登顶CLUE分类榜单,成绩首次超过人类水平产品动态
1月17日,网易伏羲的“玉言”系列模型在CLUE分类任务排行榜中超越其他模型,荣登榜单第一。在CLUE1.1分类任务排行榜(包含AFQMC[文本相似度]、TNEWS[短文本分类]、IFLYTEK[长文本分类]、OCNLI[自然语言推理]、WSC[代词消歧]、CSL[关键词识...
2023-01-17 17:20:37
Visinger: Variational Inference with Adversarial Learning for End-to-End Singing Voice Synthesis学术论文
论文提出了VISinger,这是一个完整的端到端高质量歌声合成(SVS)系统,可直接从歌词和乐谱生成音频波形。我们的方法受到VITS的启发,它采用基于VAE的后验编码器,增强了基于标准化流的先验编码器和对抗解码器,以实现完整的端到端语音生成。
2023-01-17 14:19:11
Generating Coherent Narratives by Learning Dynamic and Discrete Entity States with a Contrastive Framework学术论文
论文扩展了transformer模型来动态地进行实体状态更新和句子实现,以促进叙事性文本的生成。我们提出了一个对比框架来学习离散空间中的状态表征,并在解码器中插入额外的注意力层到解码器中,以更好地利用这些状态。
2023-01-17 14:11:52
LayerConnect: Hypernetwork-Assisted Inter-Layer Connector to Enhance Parameter Efficiency学术论文
论文提出了LayerConnect(超网络辅助层间连接器)来提高推理效率。具体来说,在两个Transformer层之间插入一个具有线性结构的轻量级连接器,每个连接器内部的参数由一个由插值器和下采样器组成的超级网络进行调整。
2023-01-17 14:05:15
网易为央视网成功打造了网络春晚首个元宇宙会场
网易为央视网成功打造了网络春晚首个元宇宙会场产品动态
作为此次2023网络春晚的虚拟技术支持,网易为央视网成功打造了网络春晚首个元宇宙会场,在小年夜将顶尖的数实融合技术呈现给数亿观众,并与上万网民一起在虚拟元宇宙会场沉浸式过小年。
2023-01-17 09:53:30
扩散模型和潜在扩散模型的关系新闻资讯
扩散模型在图像修复和图像生成等任务中非常流行,简单来说,扩散模型就是对VAE、GAN和流模型等现有模型的改进。潜在扩散模型则是扩散模型的改进。
2023-01-16 14:43:55
下拉查看更多

在线客服

合作咨询