Gene Rsph17025_0420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_0420
Symbol
ID	5082508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	416743
End bp	417846
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	67%
IMG OID	640481972
Product	3,4-dihydroxy-2-butanone 4-phosphate synthase
Protein accession	YP_001166631
Protein GI	146276472
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.52753
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.132097
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCACA CGAAGACCGA ATATTCCGAC GCGATCTCTC CGATCGAGGA GATCATCGAC 
GACGCTCGCA ACGGGCGGAT GTTCATCCTC GTGGACCATG AGGACCGCGA GAACGAGGGT 
GACCTCGTGA TCCCCGCGCA GATGTGCACG CCGGCCGCCA TCAACTTCAT GGCCACTCAC 
GGGCGCGGGC TGATCTGCCT TGCACTGCCT TCGGCGCGGG TGGACCAGTT GGGCCTGCAC 
CTGATGGCGC CGAAGAACTC GTCGCGCCAC GAGACCGCCT TCACCATCTC GATCGAGGCC 
CGCGAGGGCG TCACGACCGG GATCTCGGCG GCCGACCGGG CCCGCACCGT GGCCGTCGCC 
ATCGACCCGA CGAAGGGTCC GCAGGACATC GCGACCCCGG GCCATGTCTT CCCGCTGCGT 
GCGCGGGACG GGGGCGTGCT CGTGCGCGCG GGCCATACCG AGGCCGCGGT GGACGTGAGC 
CGCCTTGCGG GTCTGAACGC GTCGGGCGTG ATCTGCGAGA TCATGAACGA CGACGGCACC 
ATGGCCCGCC TGCCGGATCT CGTGGCCTTC GCCCAGCGGC ACGGGCTGAA GATCGGCACG 
ATCTCGGACC TGATCGCCTA CCGCCGCCGG CATGACAATC TCGTGAAGGA GAAGGCGGTC 
AAGCACGTCA CCTCGTGCTA CGGCGGCGAC TGGCTGATGC GCATCTTCGC CGACGACACG 
CAGGGCGCCG AGCATGTGAT CCTCTCGAAG GGCAATGTCA CGGACGGCGA GCCGGTGCTG 
GTGCGGATGC ATGCGCTCAA CCCGCTCGAG GATGTGCTGG GCATCGGCTC GGCCCATGCG 
GGCGATCTGC ACGGCGCGAT GCGGCTGATC GCGCAGGAGG GTCGCGGCGT GGTCGTGCTC 
TTGCGCGACG TCACCATGAA GCTCGTGATG GATGACGAGG CCTCGCCGCA GACGCTGCGC 
CAGTATGGGC TCGGCGCCCA GATCCTCTCG GCGCTCGGCC TGTCGCAGAT CGTGCTTGTC 
ACCAATTCCC GTGCGCCGAA GGTGGTGGGG CTTGAGGCCT ACGGCCTCTC CATCGTCGGC 
ACGCACCATA TTTCCGAGGT CTGA

Protein sequence

MSHTKTEYSD AISPIEEIID DARNGRMFIL VDHEDRENEG DLVIPAQMCT PAAINFMATH 
GRGLICLALP SARVDQLGLH LMAPKNSSRH ETAFTISIEA REGVTTGISA ADRARTVAVA 
IDPTKGPQDI ATPGHVFPLR ARDGGVLVRA GHTEAAVDVS RLAGLNASGV ICEIMNDDGT 
MARLPDLVAF AQRHGLKIGT ISDLIAYRRR HDNLVKEKAV KHVTSCYGGD WLMRIFADDT 
QGAEHVILSK GNVTDGEPVL VRMHALNPLE DVLGIGSAHA GDLHGAMRLI AQEGRGVVVL 
LRDVTMKLVM DDEASPQTLR QYGLGAQILS ALGLSQIVLV TNSRAPKVVG LEAYGLSIVG 
THHISEV