Gene Mlg_0377 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0377
Symbol
ID	4269002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	421933
End bp	423048
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	69%
IMG OID	638125108
Product	3,4-dihydroxy-2-butanone 4-phosphate synthase / GTP cyclohydrolase II
Protein accession	YP_741222
Protein GI	114319539
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0108] 3,4-dihydroxy-2-butanone 4-phosphate synthase [COG0807] GTP cyclohydrolase II
TIGRFAM ID	[TIGR00506] 3,4-dihydroxy-2-butanone 4-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.0664139
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGTTCA ACAGCATCGA CGAGATCATC GAGGACCTGC GCGAAGGGCG CATGGCGGTC 
ATCCTGGACG ACGAGGACCG GGAGAACGAG GGCGACCTGG TCATGGCGGC CAGCATGGTC 
CGGCCCGACG ACATCAACTT CATGGCCCGC TACGGCCGCG GTCTCATCTG CCTGACCCTC 
ACCCGCGAGC GCTGCGAGCA GCTCCGGCTG CCGCTCATGG TCCAGGACAC CGAGCAGGCC 
CAGTCCACCA ACTTCACCGT CTCCATCGAG GCCGCCACCG GCGTGACCAC CGGCATCTCC 
GCCGCGGACC GGGCGCGCAC CGTGCAGGCC GCGGTGGCGC CGCACGCAAA GCCCGAGGAC 
CTGGTCCAAC CGGGGCACAT CTTCCCGCTC ATGGCCCAGC CCGGCGGCGT GCTCACCCGC 
GCCGGGCACA CCGAGGCCGG CTGCGACCTG GCCCGCCTGG CCGGTTTCGA GCCCTCGGCG 
GTGATCGTCG AGATCCTCAA AGAGGACGGC ACCATGGCCC GGCGCGACGA CCTGATGGCC 
TTCGCCCGCG AGCACAACCT GAAGATCGGC ACGGTCGCCG ACCTGATCGC CTACCGCGTC 
CGCAACGAGC GCTCGGTGGA ACGGGTGGGC GAATGCGACC TGCCCACCGA GCACGGCATC 
TTCCACCTCT ACGCCTACCA GGACAACGTG GACAATGCCC TGCACTTCGC CCTGGTCAAG 
GGCCGGCCCC AGCCGGACAC CCCCACCCTG GTCCGGGTGC ACGTCCAGAA CACCCTCTCC 
GACGTCTTCG CCAGCGATGG GCCGCACTGC GGTTGGCCGC TGCGCGCCGC CATGCGCCAG 
GTGGCCGAGG CCGGGGAGGG CGTGGTGGTG GTGCTGCGCC GGCGCGACGA CAGCGACGAC 
ATCCTCAAGC GCATGCGCGC CTACCAGGTG CAGGCCAGTC AGGCCGACGA GAGCGAGGAG 
GCGCGCTCCA GCAGTGATCT GCGCACCTAC GGCCTGGGCG CGCAGATCCT CACCGACGTG 
GGCGTGCGCC GTATGCGCGT ACTGTCCGCC CCCAAGCGTA TGCACGCCAT TTCCGGCTTC 
GGCATGGAAG TGGTGGAATA CGTAGAGCCT GAATAG

Protein sequence

MAFNSIDEII EDLREGRMAV ILDDEDRENE GDLVMAASMV RPDDINFMAR YGRGLICLTL 
TRERCEQLRL PLMVQDTEQA QSTNFTVSIE AATGVTTGIS AADRARTVQA AVAPHAKPED 
LVQPGHIFPL MAQPGGVLTR AGHTEAGCDL ARLAGFEPSA VIVEILKEDG TMARRDDLMA 
FAREHNLKIG TVADLIAYRV RNERSVERVG ECDLPTEHGI FHLYAYQDNV DNALHFALVK 
GRPQPDTPTL VRVHVQNTLS DVFASDGPHC GWPLRAAMRQ VAEAGEGVVV VLRRRDDSDD 
ILKRMRAYQV QASQADESEE ARSSSDLRTY GLGAQILTDV GVRRMRVLSA PKRMHAISGF 
GMEVVEYVEP E