Gene Mlg_1856 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1856
Symbol
ID	4268074
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2116112
End bp	2117476
Gene Length	1365 bp
Protein Length	454 aa
Translation table	11
GC content	69%
IMG OID	638126612
Product	peptidase RseP
Protein accession	YP_742690
Protein GI	114321007
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0750] Predicted membrane-associated Zn-dependent proteases 1
TIGRFAM ID	[TIGR00054] RIP metalloprotease RseP

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCATCC TCTGGAGCAT ACTGGCGTTC GTCGTGGCCA TTGGCATCCT GGTCACGGTG 
CACGAGTTCG GCCATTTCTG GGTGGCCCGG CGGGCCGGCA TCAAGGTGCT GCGCTTCTCG 
GTGGGCTTCG GCCGGCCGCT GTTGCGCTGG CGCCGTGGGG CGGATCGCAC CGAATACGTC 
ATTGCCGCGA TCCCGCTCGG CGGCTACGTG AAGATGCTGG ACGAACGCGA GGCCGAGGTG 
CCCGAGGCCG AACGCCACCG CGCCTTCAAC GTCCAGCCGC TGTACAAGCG CACCGCCGTG 
GTGCTCGCCG GACCCTTGTT CAATTTCCTG TTCGCAGTGC TCGCTTACAT GGCCATCGGC 
CTGCTCGGCA CTGTCGAGAT GCGCCCGGTC CTGGGGCCGG TGGCGGAGAA CACGCCGGCG 
GCTGAGGCCG GTTTTCAGGA GGGCGATGAG CTGCTCGCCA TCGGCGGCCG CGAGACCCCC 
ACCTGGCAGC GCACCGCCAT GGCGCTGGTG GATGCCGGCT TTCACCGCGC CGACATCCCG 
GTGGAGGTCC GGGGCGAGGA CGGCCGTGCC CGCAGTCTGG TGCTGGACAT GACCCTGGCC 
GGTGAGATCG GGCGGGCGGA CAATCTGCTG GCGCAGGCCG GTTTCCGTCC CTGGACCCCG 
GCCTTGGACC CGGTGCTCGG CCGTGTGGTG GATGACGGGC CCGCGGCCCG GGCCGGGCTC 
ATGGCCGGCG ACCGCATCGT CTCGGTGGAG GGCGAGCCGG TGGCGGAATG GCGTGAGCTG 
GTCGAGTGGA TCGAGCACCA TCCGGGCGAG GTTCTGACCC TCACGATCGA GCGCGACGGC 
CGTCAGGAGA CCATCGATAC GCGGCTGGAC AGCGTGGAGG CGGCCGGGCG CACCATCGGT 
CAGCTTGGGG TGGCCCCCGA GGTGCCGGAG GGGGCCTATG ACCGGCTCTA CCGCGAGGTC 
CAATACGGAC CGGTCGGGGC GCTGGGCCAT GGCCTGTCCT CCACCTGGGA TGCCAGCGTG 
CTGACGGTGA AGATCCTCGG CCGTATGGTG ATCGGCCAGG CCTCGCTGCA GAATCTTAGC 
GGCCCGCTCA CCATCGGGCA GTTTGCGGGC GATACCGCCT CGCTGGGCGT GGTACCCTTC 
CTGGGCTTCC TCGCCATCGT CAGTATCAGT CTGGGGATCA TCAACCTGTT GCCGATCCCC 
ATCCTGGACG GCGGGCACTT GCTCTATTTC GCGGTCGAGG CCGTACGCGG CAAGCCGCTG 
TCGGAGTACG CCCAGGCGGT GGGCCAGCAG GTGGGGCTGC TGATGCTGTT CCTGCTCATG 
GGACTGGCGT TCTACAACGA CCTGGCGCGC CTGTTCGGCG GCTAA

Protein sequence

MGILWSILAF VVAIGILVTV HEFGHFWVAR RAGIKVLRFS VGFGRPLLRW RRGADRTEYV 
IAAIPLGGYV KMLDEREAEV PEAERHRAFN VQPLYKRTAV VLAGPLFNFL FAVLAYMAIG 
LLGTVEMRPV LGPVAENTPA AEAGFQEGDE LLAIGGRETP TWQRTAMALV DAGFHRADIP 
VEVRGEDGRA RSLVLDMTLA GEIGRADNLL AQAGFRPWTP ALDPVLGRVV DDGPAARAGL 
MAGDRIVSVE GEPVAEWREL VEWIEHHPGE VLTLTIERDG RQETIDTRLD SVEAAGRTIG 
QLGVAPEVPE GAYDRLYREV QYGPVGALGH GLSSTWDASV LTVKILGRMV IGQASLQNLS 
GPLTIGQFAG DTASLGVVPF LGFLAIVSIS LGIINLLPIP ILDGGHLLYF AVEAVRGKPL 
SEYAQAVGQQ VGLLMLFLLM GLAFYNDLAR LFGG