Gene Mlg_2658 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2658
Symbol
ID	4268548
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	3009925
End bp	3011307
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	70%
IMG OID	638127417
Product	peptidase M16 domain-containing protein
Protein accession	YP_743488
Protein GI	114321805
COG category	[R] General function prediction only
COG ID	[COG0612] Predicted Zn-dependent peptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.287658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.000609596
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGAGCCC GAATTCTGAT GGCCACCGGC CTGGCCCTCG GCCTGGCCTG GCTGGTCCCG 
CCGGCGGTGG CCGGCACGCC CGCGGTCCAC GAGTACACGC TGGACAACGG CATGACGGTG 
GTGGTGCGCG AGGACCACCG GGCGCCGGTG GTGGTGAGCA TGGTCTGGTT TGCCGTCGGC 
TCCAGCTACG AACAGCGGCC GCTGACCGGC ATCTCCCACG TGGTCGAGCA CATGATGTTC 
AAAGGCACGG AGACCCGCCC GACCGGCGAG TTTTCCCGTC TTATCGCCGA GCGTGGGGGG 
CGCCAGAACG CCTTCACCGG CCGGGATTTT ACCGGCTACC ACCAGCAGCT GGCGGTGGAG 
CACCTGCCTT TGGCCTTCGA GTTGGAGGCC GACCGCATGC AGAACCTGGT CTTCGATCAG 
GGTGAGTACG AGCGTGAGAT GGAGGTGGTG CGCGAAGAGC GCCGTCAACG GGTGGAGGAC 
AACCCCACCG CCAAGTTCAT GGAGCGCTTC CGGGCCGTGG CCTGGAGCGC CAGTCCCTAC 
GGCCAGCCGG TGATCGGCTG GATGGAGGAC CTGGACCGGT TGCGCCTGTC CGAGGTGGAG 
GACTGGTACC GGCGCTGGCA CGGCCCGGAG AGCGCCACCC TGGTGGTCGT CGGCGCCGTG 
GACCCGGATG CGGTTTTTGC CCTGGCCGAG GAGCATTTTG GTCCAGTCCC GGCCCGCGAG 
CGGCCCGAAC CCATCCCCGG CGGCGATATC CCCGACCCGG GTGAGCGCGC CGTGACCGTG 
CGTATCCCGG CGGAACTCCC CTACCTGGCC ATGGGCTGGC GGGTGCCCAC CCTGGGCAGT 
ATCGACCGGG AAGACGAGGA GGCCCTGCGT GAGGTCTACG CCCTGGCGCT GCTTCGCGCC 
GTGCTCTCCG GCGGCCAGGC GGCCATCCTG CCCGAGCGCC TGGAGCGGCA GCAGGGCGTG 
GCCGTGGGCG CCGGGGCCAG CTATTCCGCC ACCGCGCGCC TCCAGGATCT GTTCCTGCTT 
GCCGGCCGCC CCGCACCCGG CGCCGGACTG GACGAGCTGG AGGCCGCCCT GCGCGAGGAA 
GTGCAGCGGT TGCAGGAGGA GCCGCTGGAC GAGGAGCGGT TGGTCCGCGC CCGCCGCCAG 
TACGTGGCGG ATGAACTCTT CAGTCAGGAC TCCATGCGGG CGCAGGCGAT GCGTCTGGGG 
GCGCTGGAGA GCACCGGGAT CGGCTGGGAG GCCGGTGAGC GCTTCCTGGA GGGGGTGCAG 
ACCGTGACCG CTGAGGACAT CCAGCGCGTC GCCCGGCGCT ACCTGGTGGA TGATCAGCTC 
ACGGTGGGTC GCCTGGTGCC CGCCGACCGC GAGGCGTCCA CTGACGCCGG GGAGGAGCAA 
TGA

Protein sequence

MRARILMATG LALGLAWLVP PAVAGTPAVH EYTLDNGMTV VVREDHRAPV VVSMVWFAVG 
SSYEQRPLTG ISHVVEHMMF KGTETRPTGE FSRLIAERGG RQNAFTGRDF TGYHQQLAVE 
HLPLAFELEA DRMQNLVFDQ GEYEREMEVV REERRQRVED NPTAKFMERF RAVAWSASPY 
GQPVIGWMED LDRLRLSEVE DWYRRWHGPE SATLVVVGAV DPDAVFALAE EHFGPVPARE 
RPEPIPGGDI PDPGERAVTV RIPAELPYLA MGWRVPTLGS IDREDEEALR EVYALALLRA 
VLSGGQAAIL PERLERQQGV AVGAGASYSA TARLQDLFLL AGRPAPGAGL DELEAALREE 
VQRLQEEPLD EERLVRARRQ YVADELFSQD SMRAQAMRLG ALESTGIGWE AGERFLEGVQ 
TVTAEDIQRV ARRYLVDDQL TVGRLVPADR EASTDAGEEQ