Gene Dole_2077 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2077
Symbol
ID	5694920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2528432
End bp	2529646
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	59%
IMG OID	641264678
Product	3,4-dihydroxy-2-butanone 4-phosphate synthase
Protein accession	YP_001529958
Protein GI	158522088
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00505] GTP cyclohydrolase II [TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0721218
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGTAC TGAGTATCGA AGAGGCAATA AAGGATGTTC GCGCCGGTAA AATGGTGATT 
CTCGTTGATG ACGAGGACCG TGAAAATGAA GGGGACCTGA TGATCGCCGC GGAGAAGACG 
ACCCCCGAGG CGGTTAACTT CATGGCAAAG TACGGCAGGG GCCTGATCTG TCTGGCCCTG 
GACGCCAAAA AGGTGGAAGA ACTGGACCTG CCCCTGATGG TGGACAGAAA CACCTCCCCC 
TTTGGAACCG GTTTTACGGT TTCCATAGAG GCCAAGCAAG GCGTGACCAC CGGTATTTCA 
GCGGCGGACC GGGCCACCAC GATTCTGGCT GCCGTGGCCG ACGGCGCCAG GCCCGACGAC 
CTGGTGCGGC CGGGTCACAT ATTTCCTTTG CGGGCACGGC GGGGCGGTGT CATTGTGCGG 
GCCGGGCAGA CCGAGGGCTC GGTGGACCTG GCCCGGCTGG CCGGACTGAA ACCCGCCGGC 
GTGATCTGCG AGGTCATGAA CGACGACGGC ACCATGGCCC GCATGCCCCA GCTGGAGGAG 
TTCAGCGAGG CTCACGGCAT CGGCATCTGC ACCATAGCGG ACCTGATCGA GTACCGCATG 
CGCACCGAGT CCTTTGTGCG CAAGGTGGTG GAGACCACGA TCCCCTCCAT GTTCGGCGGC 
ATCTTCAAGG TGATCGTGTA CGAAAACGAC ATGGAAGATT TTCAGCATAT CGCCCTGGTC 
AAGGGAGAGA TTGACCCCGA CAAACCGGTA CTGGTGAGGG TTCACTCCGA GTGCCTCACC 
GGAGACATTT TCGGCTCCCT GCGGTGTGAC TGCGGCAACC AGCTGCACAA GGCCATGGAG 
ATGATGGAAA AAGAGGGGGC CGGGATTCTG CTTTATGTTC GTCAGGAGGG CCGCGGCATC 
GGCCTGGTGA ACAAGCTCAA GGCCTATAAT CTTCAGGACC AGGGCTACGA CACGGTGGAA 
GCCAACGAGC AGCTGGGCTT CAAGGCCGAC CTGCGGGATT ACGGCATCGG CGCCCAGGTG 
CTGGCCGATC TGGGGGTGAA AAAGATGCGG CTGATCACCA ACAATCCGAA AAAGATCGTC 
GGCCTGGAGG GCTATGGCCT CTCCGTGGTG GAGCAGATTC CCATTGAGAT CGAGGCCAAT 
GAACACAACA AGCGCTACCT GGAGTGCAAA AAACTCAAGA TGGGCCACCT GTTGAACCTT 
GACTGCACGC CTTAA

Protein sequence

MAVLSIEEAI KDVRAGKMVI LVDDEDRENE GDLMIAAEKT TPEAVNFMAK YGRGLICLAL 
DAKKVEELDL PLMVDRNTSP FGTGFTVSIE AKQGVTTGIS AADRATTILA AVADGARPDD 
LVRPGHIFPL RARRGGVIVR AGQTEGSVDL ARLAGLKPAG VICEVMNDDG TMARMPQLEE 
FSEAHGIGIC TIADLIEYRM RTESFVRKVV ETTIPSMFGG IFKVIVYEND MEDFQHIALV 
KGEIDPDKPV LVRVHSECLT GDIFGSLRCD CGNQLHKAME MMEKEGAGIL LYVRQEGRGI 
GLVNKLKAYN LQDQGYDTVE ANEQLGFKAD LRDYGIGAQV LADLGVKKMR LITNNPKKIV 
GLEGYGLSVV EQIPIEIEAN EHNKRYLECK KLKMGHLLNL DCTP