Gene Rsph17029_2414 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2414
Symbol
ID	4897808
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2545882
End bp	2546985
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	67%
IMG OID	640113012
Product	3,4-dihydroxy-2-butanone 4-phosphate synthase
Protein accession	YP_001044288
Protein GI	126463174
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.246802
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCACA GCAAGACCGA ATATTCCGAC GCGATCTCGT CCATCGAGGA GATCATCGAC 
GACGCGCGAA ACGGGCGGAT GTTCATTCTC GTGGACCACG AGGACCGCGA GAACGAGGGC 
GACCTCGTCA TCCCCGCGCA GATGTGCACC CCCGCCGCCA TCAACTTCAT GGCGACCCAC 
GGGCGCGGGC TGATCTGCCT CGCCTTGCCG TCGGCGCGGA TCGACCAGCT CGGCCTGCAT 
CTGATGACTC CGAAGAACTC CTCGCGGCAC GAGACGGCCT TCACCATCTC GATCGAGGCG 
CGTGAGGGCG TCACCACCGG CATTTCGGCC GCCGACCGGG CCCGCACCGT GGCCGTGGCC 
ATCGATCCGT CCAAGGGGCC TGCCGATATC GCGACGCCCG GCCATGTCTT CCCGCTCCGC 
GCCCGGGACG GGGGCGTCCT CGTCCGGGCC GGCCATACGG AGGCCGCGGT CGACGTGAGC 
CGTCTGGCCG GTCTCAACGC CTCGGGCGTG ATCTGCGAGA TCATGAACGA CGACGGCACC 
ATGGCCCGCC TGCCGGATCT CGTGGCCTTC GCCCAGCGGC ACGGTCTCAA GATCGGCACG 
ATCTCGGACC TGATCGCCTA CCGTCGCCGG CACGACAATC TGGTGAAGGA GAAGGCGGTC 
AAGCACGTCA CCTCCTGCTA CGGCGGCGAC TGGCTCATGC GCATCTTCTC CGACGACACG 
CAGGGGGCCG AGCATGTCAT CCTGTCGAAG GGCAATGTCA CCGACGGCGA GCCGGTGCTG 
GTGCGGATGC ATGCGCTGAA CCCGCTCGAG GATGTGCTGG GCATCGGCCC CGCCCATGCG 
GGCGATCTGC ACGGCGCCAT GCGCCTGATC GCGCAGGAGG GGCGGGGCGT GGTCGTGCTG 
CTGCGCGACG TCACGATGAA ACTTCCGATG GACGACGAGG CCTCGCCGCA GACGCTGCGC 
CAGTATGGTC TGGGCGCCCA GATCCTCTCG GCGCTGGGCC TGTCCCAGAT CGTGCTCGTC 
ACCAACTCCC GTGCGCCGAA GGTGGTGGGT CTCGAGGCCT ATGGCCTCTC CATCGTCGGC 
ACGCACCATA TTTCCGAGGT CTGA

Protein sequence

MSHSKTEYSD AISSIEEIID DARNGRMFIL VDHEDRENEG DLVIPAQMCT PAAINFMATH 
GRGLICLALP SARIDQLGLH LMTPKNSSRH ETAFTISIEA REGVTTGISA ADRARTVAVA 
IDPSKGPADI ATPGHVFPLR ARDGGVLVRA GHTEAAVDVS RLAGLNASGV ICEIMNDDGT 
MARLPDLVAF AQRHGLKIGT ISDLIAYRRR HDNLVKEKAV KHVTSCYGGD WLMRIFSDDT 
QGAEHVILSK GNVTDGEPVL VRMHALNPLE DVLGIGPAHA GDLHGAMRLI AQEGRGVVVL 
LRDVTMKLPM DDEASPQTLR QYGLGAQILS ALGLSQIVLV TNSRAPKVVG LEAYGLSIVG 
THHISEV