Gene Mlg_1606 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1606
Symbol
ID	4268304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1835534
End bp	1836607
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	70%
IMG OID	638126363
Product	glycosyl transferase, group 1
Protein accession	YP_742442
Protein GI	114320759
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.444102
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGCGG GGGAGGCGCC AGAGAGGCCA CGGGTCTGGC TGCTCTCGGC CTATCGCGCC 
GACAGCCATC GAGCCTGGGC CGACGGGCTG GTGCGCAGCC AGAGTGGGGT GGACTGGGCA 
CGGCGGGAGC TGCCCGGGCG CTTCTTTCGC TGGCGGATCC GCGGCAATCC GCTCTCCTGG 
CTGGGCGGCC TGCCGGAAGA CCGACCGGAC CTCATCCTGG CCACGTCGAT GGTGGATTTG 
GCCACCCTGC GGGGGCTCAA CCCCCGCCTG GCGCGGGTCC CGGCCTATTA CTATTTTCAT 
GAGAACCAGT TCGCTTACCC GGTCAGTCCC CGCCAGGTGA AGAGCGTTGA GCCGCAGATG 
GTGCAACTCT ACGGCGCCCT CGCCGCGCAG CGGCTGCTGT TTAACTCCGC GTTCAACCGG 
GACAGCTTCC TGTCGGGGGT GCGGACCCTG TTGCGTAAGA TGCCGGATGC CGTACCCGGC 
GGCATCGTGG AGGCCCTGGC AGCCCGGGCC GCGGTCCTGC CGGTGCCGGT GGAGCCGCTG 
CCCCCCGGGC AGCGGGACCC GCGCCTGATC CTTTGGAACC ACCGGTGGGA ATACGACAAG 
CGACCGGATC TGTTCGCGGA TGCCATGCTG GCGTTGCATC GCCGCGGTGC CGACTTCCGC 
CTGGCCCTGC TGGGCGCGCG GCCGGAGCCG GCACCGGAAC CCCTGCGCCG GCTGCGCCAG 
GCATTGCCTG AACGTATCGT GGCCGATGGT CGGGTGGATC GGGCAGAATA CCGTCACCTG 
CTGGCCCGGG CCGGGGTGGT GGTCAGTACC GCGGAGCATG AGTTTCAGGG GCTGGCCATG 
TTGGAGGCGG TAAGCGCCGG GGCCTGCCCG TTGGCCCCTG ACGCGCTCTG CTACCCGGAG 
CAGTATCCGC CCGCGCACCG TTACCCGGGC GGTGACCACC GGGCCCTGGT GGAACGCCTG 
TATGGCTGGC TTCGTGATGG CCCCCCGCCG GCACCGGATG TCTCCGGCTG GCTGGCGCCG 
CGCCTGGAAC CGGCCTGGCG AGCACTGTTG ACCCCGCCAT TCGAGGATGA CTGA

Protein sequence

MTAGEAPERP RVWLLSAYRA DSHRAWADGL VRSQSGVDWA RRELPGRFFR WRIRGNPLSW 
LGGLPEDRPD LILATSMVDL ATLRGLNPRL ARVPAYYYFH ENQFAYPVSP RQVKSVEPQM 
VQLYGALAAQ RLLFNSAFNR DSFLSGVRTL LRKMPDAVPG GIVEALAARA AVLPVPVEPL 
PPGQRDPRLI LWNHRWEYDK RPDLFADAML ALHRRGADFR LALLGARPEP APEPLRRLRQ 
ALPERIVADG RVDRAEYRHL LARAGVVVST AEHEFQGLAM LEAVSAGACP LAPDALCYPE 
QYPPAHRYPG GDHRALVERL YGWLRDGPPP APDVSGWLAP RLEPAWRALL TPPFEDD