Gene Rsph17029_2046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2046
Symbol
ID	4897654
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2168025
End bp	2169095
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	76%
IMG OID	640112639
Product	riboflavin biosynthesis protein RibD
Protein accession	YP_001043921
Protein GI	126462807
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0117] Pyrimidine deaminase [COG1985] Pyrimidine reductase, riboflavin biosynthesis
TIGRFAM ID	[TIGR00227] riboflavin-specific deaminase C-terminal domain [TIGR00326] riboflavin biosynthesis protein RibD

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.515764
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCACG CGCTCCGGCT GGGCGCGCGC GGGCTCGGGC GGACCTGGCC CAACCCGGCG 
GTGGGCTGTG TCATCGTGAA GGCCGGTCGC GTGGTGGGCC GCGGCTGGAC CCGCCCCGGC 
GGGCGTCCCC ATGCCGAGCC GGTGGCGCTG GCCCAGGCCG GCGCGGCGGC GCTGGGCGCC 
ACCGCCTACG TCACGCTCGA ACCCTGCTCG CACCATGGCC GGACGCCGCC CTGCGCCGAG 
GCGCTGATCG CGGCCGGTCT CGCCCGGGTG GTGACCGCCA CGGGAGATCC GGATCCCCGT 
GTCTCGGGAC GGGGTCATGC GATGCTGCGG GAGGCCGGCA TCGCCGTCAC CGAACGGGTG 
CTCGAGGCCG AGGCGCGCGC GGCCCATGCG GGCTTCCTGA AGCGCGTGAC CGAAGGGCTG 
CCCTTCGTCA CGCTGAAGCT CGCGGCGACC GTCGACGGGC GCATTGCCAC CGCCTCGGGA 
GAGAGCCGCT GGATCACCGG CAGCCTCGCG CGCCGGGCGG TTCATGCGAT GCGGATGCGC 
CACGATGCGG TGATGGTGGG GGTGGGCACC GCCATCGCGG ACGACCCGGA TCTTTCGGTG 
CGCGATCTTG GCTCCGGACA CCAGCCGGTG CGGATCGTGG TGGACAGCCT CCTGCGGCAC 
GCGCCCGACA GCCGGCTTGG CCGCACCGCG CGGCAGGTGC CGGTCTGGCT CTGCCATGGG 
CCGGCCGCGC CCGAGGCCGC GCGCGCGGCC TGGGCGGCCT CGGGCGCGAT CCTGCTCGAA 
TGTCCGGCAG GCCCCGACGG GCTCGAGGCC GAGGCGGTTC TGCGCCGCCT TGCCGCCGAG 
GGGCTCACCC GGATCTTCTG CGAGGGCGGG GCCCGGCTTG GCGCCGCACT GGTGCGGGCG 
GGGCTCTGCG ACGAGCTCGT CACCTTCACC GCGGGCAAGC TCATCGGCGA GGAAGGGCGC 
GGCGCGATGG GCGCGCTGCG CCTCGCCCGG CTGGCCGAAG CGCCGGCCTA CCGGCTGGCC 
TCCCTCGACA TGGTGGGGGG GGATCTGCTG GCCCGCTGGC AGAGGCTCTG A

Protein sequence

MAHALRLGAR GLGRTWPNPA VGCVIVKAGR VVGRGWTRPG GRPHAEPVAL AQAGAAALGA 
TAYVTLEPCS HHGRTPPCAE ALIAAGLARV VTATGDPDPR VSGRGHAMLR EAGIAVTERV 
LEAEARAAHA GFLKRVTEGL PFVTLKLAAT VDGRIATASG ESRWITGSLA RRAVHAMRMR 
HDAVMVGVGT AIADDPDLSV RDLGSGHQPV RIVVDSLLRH APDSRLGRTA RQVPVWLCHG 
PAAPEAARAA WAASGAILLE CPAGPDGLEA EAVLRRLAAE GLTRIFCEGG ARLGAALVRA 
GLCDELVTFT AGKLIGEEGR GAMGALRLAR LAEAPAYRLA SLDMVGGDLL ARWQRL