Gene Mlg_2793 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2793
Symbol
ID	4269727
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	3175949
End bp	3177082
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	70%
IMG OID	638127555
Product	glycosyl transferase, group 1
Protein accession	YP_743623
Protein GI	114321940
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.09685
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACCTGG CCTTCGCCCT GTTCAAGTAC TTCCCCCACG GCGGCCTGCA GCGCAACTTC 
CGGCGCATCA CCGAGCTGGC GCTGGAGCGC GGCCATCGGG TCGATGTCTA CACCCTGGCC 
TGGAGTGGCT GGACGCCGGA ACATCCGAAC CTGACGGTGG AGGTGGTGAA GGTGCCCGGC 
TGGCGCAACC ACACCCGCTA CCGCCGCTTT GGTACCCACG TGCAGAAACG CCTGGCGGAC 
AACCCGCCCG ACCGGGTGGT GGGCTTCAAC AAGATGCCGG GGCTCGATGT CTACTACAAC 
GCCGACCCCT GCTTCGTGGA GCGGGCGCAG GCGCGCCACC CGCTCTACCG CTGGTCGGGG 
CGCTACCGCC AGCACGCCGC CTTTGAGCAG GCCGTCTTCC GCGCCGACGC CCGCAACCAC 
ATCCTGCTGC TATCCGAAGC GGAGAAGCCG CTCTTCCAGC GCTGGTACGC CACCCCCGAC 
GACCGTTTCC ACCTGATGCC GCCCTACGTC TCCACCGACC GCTTCGCCGG CCCCGAGGCC 
CCGCACATCG GCGCCGGCCT GCGCCGGGAG CTGGGCCTGG GCGAGGCGGA CCGCATGCTG 
CTGATGGTGG GCTCCGACTT CCGTCGCAAG GGGGTGGATC GCAGCATCCG TGCACTGGCC 
GCCCTGCCCG AATCGCCGCG GCGACGCACC CATCTCTATG TGCTGGGCAA GGGTCGTGCG 
GCAACCCAGG AAGCCCTGGC CCGGGGGCTC GGCGTGGCGG ACCAGGTGCA CTTCCTGCAG 
GGCCGGGACG ACGTGGCACG CTTCCTCTTC GCCGCCGACC TGCTGCTCCA CCCGGCCTAC 
CAGGAGAACA CCGGCACCGC CATTGTCGAG GCCATCGCCG CCGGGTTGCC CGCACTGGTG 
ACCGGGAATT GCGGCTACGC CTTCCACATT GAGCGCGCCG GCAGCGGCCG GGTCCTGCCA 
CCGCCCTTCA CCCAGGCGGC CATGGACGAG GCCCTGGCTT CGATGATCGA CAGCCCCGAG 
CAACCCCGCT GGCGCGAATA CGCCCGGACC TACGCCCGCC GGACCGAACT GGGCAGCCGC 
GCCGAGCACG CCCTGCGGGT CATCGAAGGC CCCCGCTACG GGGAGCATGG GTGA

Protein sequence

MHLAFALFKY FPHGGLQRNF RRITELALER GHRVDVYTLA WSGWTPEHPN LTVEVVKVPG 
WRNHTRYRRF GTHVQKRLAD NPPDRVVGFN KMPGLDVYYN ADPCFVERAQ ARHPLYRWSG 
RYRQHAAFEQ AVFRADARNH ILLLSEAEKP LFQRWYATPD DRFHLMPPYV STDRFAGPEA 
PHIGAGLRRE LGLGEADRML LMVGSDFRRK GVDRSIRALA ALPESPRRRT HLYVLGKGRA 
ATQEALARGL GVADQVHFLQ GRDDVARFLF AADLLLHPAY QENTGTAIVE AIAAGLPALV 
TGNCGYAFHI ERAGSGRVLP PPFTQAAMDE ALASMIDSPE QPRWREYART YARRTELGSR 
AEHALRVIEG PRYGEHG