Gene Mlg_1158 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1158
Symbol
ID	4270664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1357091
End bp	1358179
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	71%
IMG OID	638125907
Product	hypothetical protein
Protein accession	YP_741997
Protein GI	114320314
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.946147
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCAGA CCGTACTGCT CGTTGGCACC CAAAAGGGCC TGTTCCGGCT GGAGGACACC 
CCTGACCGGA CCGGTTGGGA GCTGGCCGGG CCGCTGATCG CCGGATACGA GGTGCTGCAC 
GCCTGGCTGG ACCCGCGCGA CCCGCAGCGG GGGCTGGCGG CGGTGGACCA CCCCGTGTGG 
GGCGCGCATA TCTACCGCAC CGACGATGCC GGCCACCGCT GGGAACCGCT CGCCGGCGTG 
CCCCTGCACC GCCCCGGGCT GTGGCCCAAG CGGATGAAGG CGGTCTGGCA CCTGGCGCCG 
GGACCGGCCG AGGCCCCGGG GACGGTCTAC GCCGGCACCG ATCCGGCCGG CCTGTTCCGC 
AGCGATGATT ACGGCCAGAG CTGGACGCCT GTGGCGTCAC TCAACGAACA CCCCACGCGG 
GACACTTGGG AGCCGGCCCG CGGTGGCTTT TCGTTGCATT CCATCCTGAT CGACCCGCAA 
TCGCCGCAAC GCCTCTACGT AAGCATCTCG GCCGGGGGAG TCTTCCGCAG CGACGACGGC 
GGGCGAAGCT GGCGCCCCTG CAACGAGGGG GTCCGCGCCG AGAACCTGCC CGGCCGCTGC 
GCCGTGACCG GCCACAACGT GCACCGCACG GTGCTCTGTC CGCGCCGGCC GGAGCGGCTC 
TACCGGCAGT GTTACAACGG CGTCTACCGC AGCGACGACC GGGGCGGGCA CTGGACGGAG 
ATCTCCTCCG GACTGCCCAG CGATTTCGGC TACGCCCTGG CCACCCCGCC GCAGGATCCG 
GACACGGTGT ACGTCATCCC CATTGAGAGC AACCACCTGC GGACCTGCTG CGACGGCCGC 
CTGCGCGTCT ACCGCAGCCG TGACGGTGGC CGACACTGGG CGCCCCTGAC CCGGGGATTG 
CCGCAACGCC ACGCCTACGT CACCGTCCTG CGCGAGGCCA TGGCCCAGGA CGGTGCCGAT 
CCGGCGGGGC TGTACTTTGG CACCTCCAGC GGCCACCTGT TCGCCAGCCG CGACGGCGGC 
GAGCACTGGG AGACGGTGGC GGAGTTCCTG CCCCGGGTGC TCTCAGTGCA GGCCGCCCGC 
TGTTACTAA

Protein sequence

MTQTVLLVGT QKGLFRLEDT PDRTGWELAG PLIAGYEVLH AWLDPRDPQR GLAAVDHPVW 
GAHIYRTDDA GHRWEPLAGV PLHRPGLWPK RMKAVWHLAP GPAEAPGTVY AGTDPAGLFR 
SDDYGQSWTP VASLNEHPTR DTWEPARGGF SLHSILIDPQ SPQRLYVSIS AGGVFRSDDG 
GRSWRPCNEG VRAENLPGRC AVTGHNVHRT VLCPRRPERL YRQCYNGVYR SDDRGGHWTE 
ISSGLPSDFG YALATPPQDP DTVYVIPIES NHLRTCCDGR LRVYRSRDGG RHWAPLTRGL 
PQRHAYVTVL REAMAQDGAD PAGLYFGTSS GHLFASRDGG EHWETVAEFL PRVLSVQAAR 
CY