Gene Mlg_0115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0115
Symbol
ID	4268202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	127750
End bp	128769
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	49%
IMG OID	638124841
Product	glycosyl transferase family protein
Protein accession	YP_740962
Protein GI	114319279
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTATCCC GGAGAACCGA ATTGGCTACG ACCGACCGGA AAATTGCTGT CATCATACCT 
TATTTCCAGC GGCAGCCAGG CCTGTTGCGG CAGTGTGTGC GCTCAGTGCT GGATACCAAA 
GGTGATGTCG ACCCGTTAAT CATCATCGTA GATGATGGTT CTCCGATACC GGCTCAGGAC 
GAGGTCGGCG ACCTCCATGA CGGCATCAGT TTGACCATTA TACGTCAAAA AAACTCAGGG 
CCTGCCGCTG CACGAAACAC AGGACTGGAC CATGTTTCCG GCGGCACACG ATTCGCGACT 
TTCCTAGACT CGGATGATTG TTGGGTCGAG CAATTTCTTC CAGACGCCGT CTGGGCGCTG 
CAAAGAGAAT GCGAACTCTT TATTGGTAAC ACAAGAAGAA AAGGTAGTAA ACCCCGTTTT 
TCCTGGAGCA AGGACTCTTC TCGAAACATC GAGCCACACA AGCACACCCT AATAAACCAG 
AAGCGAGATA TTTATAATTT TCGGGGCGAC TTTTTTGACC TGATGGTCTT CCGGAGCAAC 
TTAGTAAGCG CGACGGCCAT GGCGTATAGA ATAGACAAAT TTCCCTCGTT ACGCTTCCCG 
GAACATCTAT TTCAGGGAGA AGATCGGCTG TTTAAATTGC GGCTAAGCAA AAGGCTAAAA 
AGCATAGCGT TCTCTCCAAA GGTTTACGCT GAAGAAGGAG AGGGAGTAAA TGTGCTGGAC 
AAGTCCGGAT GGCAGACAGA AGGACACCTA CGACTTACTT CTAGCTACAT AAAAATGTCC 
ACGATGATCC TGAACGAAAT CGACTTAACG TCACGACAAA GAGGTCATGT GTGCCGTGAG 
CTTTCTGAGT TTCGTAGAGC GTTTGTGGCC ACAATATTGC ATAATATTCG CCATCGAAAG 
CCATTGAATT GGGGCTGCGT GAGATCCACT CTACGGCATG ACCCCTACGG GGCCGCATTT 
ATTCTACCCA ATGTTATTCG TATCTTGGGA AAGAAAGCCA TTGGAGCAAA AAATACCTAG

Protein sequence

MLSRRTELAT TDRKIAVIIP YFQRQPGLLR QCVRSVLDTK GDVDPLIIIV DDGSPIPAQD 
EVGDLHDGIS LTIIRQKNSG PAAARNTGLD HVSGGTRFAT FLDSDDCWVE QFLPDAVWAL 
QRECELFIGN TRRKGSKPRF SWSKDSSRNI EPHKHTLINQ KRDIYNFRGD FFDLMVFRSN 
LVSATAMAYR IDKFPSLRFP EHLFQGEDRL FKLRLSKRLK SIAFSPKVYA EEGEGVNVLD 
KSGWQTEGHL RLTSSYIKMS TMILNEIDLT SRQRGHVCRE LSEFRRAFVA TILHNIRHRK 
PLNWGCVRST LRHDPYGAAF ILPNVIRILG KKAIGAKNT