Gene Mlg_2678 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2678
Symbol
ID	4269553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	3032302
End bp	3033309
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	65%
IMG OID	638127437
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_743508
Protein GI	114321825
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000277993
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000000000000308835
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAACACC TGATTACCGG CGCGGCCGGC TTCATCGGCT ACCACACCGC CCAGGCGCTG 
CTGGCTCGCG GCGACGAGGT CGTCGGCCTG GACAACCTCA ATGACTATTA CGACCCACGG 
CTCAAACGGG CACGCCTGGC CCGGCTCGAG GGGCAGCCGG GCTTCCGCTT CGTCAAGCTG 
GATCTGGCCG ACCGGGCCGG AATGGCCGAA CTGTTCCGCG CGGAACGCTT CCAACGGGTG 
ATCCACCTGG CCGCCCAGGC GGGCGTGCGC CACTCGCTCA CCGACCCCTA CAGCTATGTA 
GACAGCAACG TGAGCGGCAC GCTGAACGTG CTTGAGGGTT GCCGCTACAA CGACGTGGAG 
CACCTCACCT ACGCCTCCAC CAGTTCGGTC TACGGGGCCC ACGAGGACAT GCCCTTCACC 
GAGCACCGGC ATACCGACCA CCCGCTGGCC ATCTATGCGG CGACGAAGAA GGCCACGGAA 
CACATGGCCC ACAGCTACGC CCACCTTTAC GGGCTGCCTT GCACCGGGTT GCGCTTCTTC 
ACCGTCTACG GCCCCTGGGG CCGCCCCGAC ATGGCGCTGT TCCTGTTCAC CCGCAAGATC 
CTCGCCGGTG AGCCCATCGA CATCTACAAC AACGGCGATC ACGGCCGGGA TTTCACCTAT 
GTGGATGACA TTGTCGACGG CGTCATCCGC GCCTCTGACC GGGTGGCCCG CCGCAATCCG 
GAGTGGGACC CGAAGCGGCC GGACACGGCC ACATCCAATG CCCCCTGGCG GATCTACAAC 
ATCGGCGCCA ACCGTCCGGT CCGCCTGATG CACTACGTCG AGGTGCTGGA GGAGGCCCTG 
GGACGCAAGG CGGAGAAAAA CTTCCTGCCG CTGCAACCGG GTGATGTGCC AGAGACCCAC 
GCCGATGTCT CGGCGCTGGC CCAGGATACC GGGTATTCAC CCAAGGTGTC GGTGGAGGAG 
GGCATCCGCC GCTTCGTCGA CTGGTACCGG GAATACCACC ACGTCTAG

Protein sequence

MKHLITGAAG FIGYHTAQAL LARGDEVVGL DNLNDYYDPR LKRARLARLE GQPGFRFVKL 
DLADRAGMAE LFRAERFQRV IHLAAQAGVR HSLTDPYSYV DSNVSGTLNV LEGCRYNDVE 
HLTYASTSSV YGAHEDMPFT EHRHTDHPLA IYAATKKATE HMAHSYAHLY GLPCTGLRFF 
TVYGPWGRPD MALFLFTRKI LAGEPIDIYN NGDHGRDFTY VDDIVDGVIR ASDRVARRNP 
EWDPKRPDTA TSNAPWRIYN IGANRPVRLM HYVEVLEEAL GRKAEKNFLP LQPGDVPETH 
ADVSALAQDT GYSPKVSVEE GIRRFVDWYR EYHHV