Gene Mlg_2806 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2806
Symbol
ID	4269149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	3190011
End bp	3191099
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	71%
IMG OID	638127568
Product	glycosyl transferase family protein
Protein accession	YP_743636
Protein GI	114321953
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0859] ADP-heptose:LPS heptosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.629835
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCGAG CCGAACTGCC GCTGACCACA CCGCCCCGCT CGCTCTGCAT CCTGCGCTTT 
TCCGCGCTGG GGGACGTCAC CCACATGACC CCGGTGGTGC GTACCCTGCA GCGGGAATGG 
CCGGAGACCC GCCTGACCTG GATCGTCGGC AAGGCCGAAC ACACCCTGGT GGGGGATATC 
CCCGGTGTGG ACTTCGCGGT CTTCGACAAG GCCGCTGGCT GGGCCGGTTA TCGGGACCTG 
TGGCGGCAAC TGCGCGGACA GCGGTTCGAC GTGCTGCTGC ACAACCAGTT CGCCCTGCGG 
GCCAATATCG CCAGCCTGGG CATCCGCGCG GACCTGCGGC TGGGTTACGA CCGGGCCCGC 
TCCCGGGACC TGCACGGGCT GTTCATCAAC GCCCGCATCC CGCCCCACCC GGGCCAGCAC 
GTCATCGACA TCTACTTCAG TTTCATCGAA ACCCTGGGGC TCCGGCGCCG GCACATGGTC 
TGGGACATTC CCGTGCCGGA GGCGGCCGAG GCCCGTGCCC GGGCACTGAC CCCGGACGAC 
ACCCCCACGC TCGTGATCAG CCCCTGCTCC AGCCACGCCC TGCGCAACTG GACGGTGGCG 
GGCTGCGCCC GGGTCGCGGA TCACGCCGCA CGCCGCCACG GACTGCGCGT GCTGATCACC 
GGCGGCCCCT CTGAGGTGGA GCGGGAGACG GGCGCGGCCA TCGCCGCGCA GGCAGAAACG 
GCGCCGGAGA ACCTGGTGGG CCAGACCTCC ATCAAGGAGA TGCTCGCCCT GTTGGGCCGC 
GCCACGGCGG TGGTGAGCCC CGATTCCGGC CCGGCGCACA TGGCCAACGC CATGGGCACG 
CCCGTGATCG GGCTCTACGC CTGCACTAAC CCCGGTCGGG CGCGGCCCTA TTACAGCGGC 
CAGTGGTGCG TTGATCGCTA TGACGAGGCC TCAAGGCGGG AGCTGGGCAG GCCCGCCAGC 
GAGATCCGCT GGGGCACCAA GATCGAGCGC CCGGGTGTGA TGGCGCTGAT CACCCCGGAG 
GACGTGATCG AACGGCTGGA TGCCCTGATG GCCGCCGGTG CCCCGCGCGC CATTCCGCCG 
GAGACCTGA

Protein sequence

MARAELPLTT PPRSLCILRF SALGDVTHMT PVVRTLQREW PETRLTWIVG KAEHTLVGDI 
PGVDFAVFDK AAGWAGYRDL WRQLRGQRFD VLLHNQFALR ANIASLGIRA DLRLGYDRAR 
SRDLHGLFIN ARIPPHPGQH VIDIYFSFIE TLGLRRRHMV WDIPVPEAAE ARARALTPDD 
TPTLVISPCS SHALRNWTVA GCARVADHAA RRHGLRVLIT GGPSEVERET GAAIAAQAET 
APENLVGQTS IKEMLALLGR ATAVVSPDSG PAHMANAMGT PVIGLYACTN PGRARPYYSG 
QWCVDRYDEA SRRELGRPAS EIRWGTKIER PGVMALITPE DVIERLDALM AAGAPRAIPP 
ET