Gene Mlg_0568 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0568
Symbol
ID	4270898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	615878
End bp	617356
Gene Length	1479 bp
Protein Length	492 aa
Translation table	11
GC content	75%
IMG OID	638125310
Product	carbohydrate kinase, YjeF related protein
Protein accession	YP_741412
Protein GI	114319729
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0000000379756
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATACAC TACCGGAATA CCTCTACACG CCGGCCCAGG TCCAGGAGCT GGACCGCCGG 
GCCATTCAGG ATCACGGCCT ACCCGGGTTG TCGCTGATGG AGCGCGCCGG CCGCCGGGGC 
TGGGAAGTGC TGCTCAAGCA CTGGCCCCAC GTGCGCCGCC TGCGGGTGCT CTGCGGCGGG 
GGCAATAACG GTGGCGACGG CTACGTGGTG GCGCGGCTGG CCCGGCGCGC CGGCCTCGGT 
GTGCGCCTGC AGGCCCTGTC CGACCCCGAC CGGCTCAACG GCGATGCCGC TACCGTGGCG 
CGCCGCTTCC AGGAGGAGGG GGGGCAGATC GAGTCCTGGG ATCCGACCGG CCTGGCGGAC 
GAGGACGTGG TGGTGGACGC CCTGCTGGGC ACCGGCCTGG ACCGGCCGGT GGAGGGGCGC 
TACCGGGAGG CGTTGCAGGC GCTGAAGGCG GCCGGCGTGC CGGTGCTGGC CATCGACGTG 
CCCTCGGGGC TCAACGCCGG CACCGGTGCC GTGATGGGGG AGGCGGTGGA GGCGCACTGC 
ACGGTGACCT TCATCGGTCT CAAGCCGGGG CTGCTCACCG GCGCCGGCCC GCAGTGTGCC 
GGCACCCTCT ACTTCGACGA CCTGGGTGTG CCGCCGGAGA TCTACCAGGA TATGGCCCCG 
GTGGCGGGTC TCTGCCGCGA TGAGCTGTTG CGCCGGTGCC TCGGCCCCCG CCCGGCCCAT 
GCCCACAAGG GCCAGTTCGG CCACGCCTTG GTGATCGGCG GTGATCTGGG CATGGGTGGT 
GCGGCGCGGA TGGCCGGCGA GGCGGCGGGC CGCACCGGGG CGGGGCTGGT CAGCGTGGCC 
ACCCGCCCGG CGCACGTCGC CGCCCTGCTG GCCGCGCGCC CGGAGCTGAT GGTCCACGGC 
CTGGACAGCG CCGAGGGCCT GGCGCCGCTG CTGGAGAAGG CCACTGCCTG GGCCCTGGGG 
CCGGGGCTGG GGCAGGGGCC GTGGGGGCGC GCGCTCTGGG AGGCGGCGCT GCGGACTGAG 
CACCCCTGCG TGCTCGATGC CGATGCCCTC AACCTGCTGG CCGCCGACCC GCGTCCCTGC 
CCCAACGCCC TGCTCACCCC CCACCCGGGC GAGGCGGCCC GGCTGCTGGG TGTGACCCCT 
GCCGAGGTGC AGGCGGATCG GCTGGCCGCG GCCGACGCGC TGGTGGAACG CTACCGCGGG 
GCAGTGGTGC TCAAGGGCGC CGGCAGTGTG ATCGCCGCCC CGGGGGCCCT GCCGCGCTTG 
GTCACCGCCG GCAATCCGGG GATGGCCAGC GGCGGCATGG GCGATGTCCT CACCGGGGTG 
GTGCTCGGGT TGCTGGCACA AGGCCTGTCC GCCGTGGAGG CGGCCGAATT GGGGGCGCTG 
GTGCATGCCC GCGCCGCTGA CCGGGCCGCC CGGGCCGGGG AGCGCGGGCT GCTGGCGGGC 
GATGTGCTGA TGGCCCTGCG TGCCGAGGTC AACCCGTGA

Protein sequence

MNTLPEYLYT PAQVQELDRR AIQDHGLPGL SLMERAGRRG WEVLLKHWPH VRRLRVLCGG 
GNNGGDGYVV ARLARRAGLG VRLQALSDPD RLNGDAATVA RRFQEEGGQI ESWDPTGLAD 
EDVVVDALLG TGLDRPVEGR YREALQALKA AGVPVLAIDV PSGLNAGTGA VMGEAVEAHC 
TVTFIGLKPG LLTGAGPQCA GTLYFDDLGV PPEIYQDMAP VAGLCRDELL RRCLGPRPAH 
AHKGQFGHAL VIGGDLGMGG AARMAGEAAG RTGAGLVSVA TRPAHVAALL AARPELMVHG 
LDSAEGLAPL LEKATAWALG PGLGQGPWGR ALWEAALRTE HPCVLDADAL NLLAADPRPC 
PNALLTPHPG EAARLLGVTP AEVQADRLAA ADALVERYRG AVVLKGAGSV IAAPGALPRL 
VTAGNPGMAS GGMGDVLTGV VLGLLAQGLS AVEAAELGAL VHARAADRAA RAGERGLLAG 
DVLMALRAEV NP