Gene Mlg_2338 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2338
Symbol
ID	4269094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2647964
End bp	2649043
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	65%
IMG OID	638127096
Product	glycosyl transferase, group 1
Protein accession	YP_743168
Protein GI	114321485
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	48
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGGTCA CGCTGCTCTC CAAGTACAGC CGCCTTGGGG CCAGCAGCCG CCTGCGCTCG 
TTGCAGTACC TGCCAGCACT GGAGGCGGCG GGCATCAATG TGACGGTATG CCCCCTGTTC 
GACGATGACT ATCTCGAGGG TCTCTACAGC GGACAAGGGC GTTCGGTCGG GTCGGTGGCT 
CGTCGCTTTG CCACCCGGGT TCGTGACCTG CGCGAATCGG CACATGCGGA TCTGCTTTGG 
TTGGAGTACG AGGCGCTGCC CTATCTGCCG CACTGGCTGG AGCACGCCCT GATGCCGCGC 
GCGCTACCCT ACGTGGTGGA CTATGACGAC GCTGTATTTC ACAACTACGA CCTGTCCGGC 
CGCGCCTGGG TGCGGCGCCT GCTGGGCCGC AAGATCGACC GGGTGATGGC CCGTGCGGCC 
ACGGTGATCT GCGGCAACGA CTATCTGGCG GCGCGCGCAC GTCAGGCGGG TGCCGGGCGG 
ATCGAATACC TGCCCACAGT GGTCGACACG GACCGTTATC CCTTTACGCG ACGGCCGGGG 
AATGCCGAGC CGGTTATCGG CTGGATCGGT TCCCCCTCCA CCCAGCACTA CGTGACGGAG 
CTTGCCCCGA TACTGGAACG CATCGGCGAG AAGCACGGTG CACGCCTCGT GCTGGTGGGC 
GCCCGTCCAG ACGTAGCGGA GTGGTTCAGG AACCTGCCTG TGGAGGTCGT CCCTTGGTCC 
GAGGACACCG AGGCGGACCA AGTGGCCCGA TTCGATATCG GCATCATGCC GTTGCCCGAC 
GGCCCTTGGG AGCGCGGAAA GTGCGGTTAC AAGCTAATCC AGTACATGGC CTGCGGTAAG 
CCAGTGATCG CCTCCCCGGT GGGGGTCAAC ATGCGGATCG TGCAGGATTG GAACTGCGGA 
TTGCTGGCCG ACGATCACGA GCAGTGGTTC CGGGCCTTGG ACCGGCTGCT TGGCGATCCC 
AGCGAAAGAG AAACATTTGG GGCGACAGGG CGTGAAGCGG TCGAGGCGCA TTACTCCCTG 
CAGGCCCAGG CACCGCGTTT GGCTGTTGCT TTGCGTGAAG CCGCCGGGGG CAAACCCTGA

Protein sequence

MKVTLLSKYS RLGASSRLRS LQYLPALEAA GINVTVCPLF DDDYLEGLYS GQGRSVGSVA 
RRFATRVRDL RESAHADLLW LEYEALPYLP HWLEHALMPR ALPYVVDYDD AVFHNYDLSG 
RAWVRRLLGR KIDRVMARAA TVICGNDYLA ARARQAGAGR IEYLPTVVDT DRYPFTRRPG 
NAEPVIGWIG SPSTQHYVTE LAPILERIGE KHGARLVLVG ARPDVAEWFR NLPVEVVPWS 
EDTEADQVAR FDIGIMPLPD GPWERGKCGY KLIQYMACGK PVIASPVGVN MRIVQDWNCG 
LLADDHEQWF RALDRLLGDP SERETFGATG REAVEAHYSL QAQAPRLAVA LREAAGGKP