Gene CPF_2819 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CPF_2819
Symbol
ID	4201940
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium perfringens ATCC 13124
Kingdom	Bacteria
Replicon accession	NC_008261
Strand	+
Start bp	3080537
End bp	3081763
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	35%
IMG OID	638083686
Product	NupC family nucleoside transporter
Protein accession	YP_697183
Protein GI	110801028
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATAGGT TTATTGGTGT AATCGGTCTT ATTTGTATTA TTGGTATAGC TGTTCTTTTT 
TCTGAAAACA GAAAGAAGAT CAACTGGAGA TTGGTTGGAA CAGGTCTTTT ATTACAAATT 
ATTTTCGCTT TATTAATCCT AAAAGTTCCT GCCGGTAGAG CAGTATTTGA ATGGATTAGT 
AGCGGAATAA CTAAGTTATT AGATTTTACT AAAGAAGGTA GTTCATTCTT ATTTGGATCA 
TTACTTGATA CAGACAAATT CGGTGTAATA TTTGCTCTAC AAGTATTACC AACTATTATC 
TTCTTCTCAT CATTAATGAG TGTACTTTAT CATTTAGGTA TAGTTCAAGT AGTAGTTAAA 
GTTATTGCTA AGGGTGTTGC TAAAGTATTA GGAACAAGTG GTGCTGAAAC TTTCAGTGCA 
GTTGGTAATA TCTTTTTAGG TCAAACAGAG GCTCCTCTAC TAGTTAAACC ATACATAAAG 
AACATGACTA GATCAGAAAT ATGTGCAATC ATGATAGGTG GTATGGCTAC TGTTGCCGGT 
GGTGTTATGG CTGGTTATGT AGCTATGGGT GTTAACGCTG GTAACTTATT AGCAGCATCA 
ATCATGGCAG CCCCTGCTGG ATTAATATTA GCTAAAATAT TAGTTCCTGA AACTGAAGTT 
CCTGAAACTA AAGGTGGCGC AACTTTAGAA CTTAAAGTTG AAAGTGAAAA TGTTATTGAA 
GCTGCTGCAA ACGGTGCTTC AGAAGGTTTA GGATTAGCTT TAAACGTTGG TGCTATGCTT 
CTTGCATTCG TTGCTCTTAT AGCTATGATC AATGCTTTAT TTGGAGCAAT TGGTGGAATA 
TTTGGTGCAC CTTGGTTAAG CTTAAACTGG ATTCTTGGTA GATTATTCTC TCCATTAGCA 
TTTATAATGG GAGTTCCAAC TAAAGACGTT TTCGCAGCTG GAGACTTACT AGGAATTAAA 
TTAGCAGTTA ATGAATTCTT AGCTTACTCA CAATTATCAA ACTACATAGC AAGCGGAACT 
TTAGAACCTA AGACTATAAT GATATTAACT TATGCTCTTT GTGGATTCGC TAACTTAAGT 
TCAGTTGCTA TACAATTAGG TGGTATCGGT GGATTAGCTC CAGAAAAGAA ACCAACTATA 
GCTAAGTTAG GATTCAAAGC ACTTTTAGGT GGTGTATTAG CTACTTGTAT GACAGCTACT 
ATAGCAGGTA TCTTATTTAG TGCTTAA

Protein sequence

MDRFIGVIGL ICIIGIAVLF SENRKKINWR LVGTGLLLQI IFALLILKVP AGRAVFEWIS 
SGITKLLDFT KEGSSFLFGS LLDTDKFGVI FALQVLPTII FFSSLMSVLY HLGIVQVVVK 
VIAKGVAKVL GTSGAETFSA VGNIFLGQTE APLLVKPYIK NMTRSEICAI MIGGMATVAG 
GVMAGYVAMG VNAGNLLAAS IMAAPAGLIL AKILVPETEV PETKGGATLE LKVESENVIE 
AAANGASEGL GLALNVGAML LAFVALIAMI NALFGAIGGI FGAPWLSLNW ILGRLFSPLA 
FIMGVPTKDV FAAGDLLGIK LAVNEFLAYS QLSNYIASGT LEPKTIMILT YALCGFANLS 
SVAIQLGGIG GLAPEKKPTI AKLGFKALLG GVLATCMTAT IAGILFSA