Gene Emin_1217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1217
Symbol
ID	6263079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1316663
End bp	1317997
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	41%
IMG OID	642611695
Product	carboxyl-terminal protease
Protein accession	YP_001876104
Protein GI	187251622
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.0468688
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAATA AAATAAACAG ACAGGCAGTT ATAATAGCGG TGGTTTTCTT TTTAGGGACT 
TTATTCCCGT ATGCTTACAG CGGTATTGAT AACGGGTTGC AAAAATTAAA AACATTAGTT 
GACGTTATTG AATTTGTAAA GGGAAATTAC GTGGAGGAAA CCAAATTTGA GGATTTGGTT 
ACCAACGCGG TAAAAGGGGT TGTTAATAAT TTAGATTTGT TTTCGGAATA TCTTCCGCCG 
AAAGATTATA AAGATTTAAA GACGGAAACA AAAGGCGAGT TCGGCGGCGT AGGCATACGT 
TTAACACAGG GAGACGGATA TTTGGAAATT TCTTCCCCCA TGCCCGGCAC GCCCGCTTTT 
GAGGCAGAAA TCATGCCTAA GGACCGCATT ACGCATATTG ATAAGGAAAG TGTTGCAAAT 
ATGACTTTGG AAGAAGCAGT TGAAAAAATG CGCGGTAAGA TAGGTTCCAA AGTAAGGCTT 
ACGATAATGC GTAAAAAAGA AAACAGCGAA GAATTTGAAA CTTTGCCTGA CTTTATTTTG 
AAAAGAGCTA AAATTGTGCC GGAAGTTGTT TACTACAGAA TGCTTGAAGA CGGTATAGGA 
TATATATATG TTATAGATTT TTCCGGACAT ACCATGGAAA AATTAGAGCA GGCTTTAAAG 
AGTTTGCACA AACAAGGCAT GACAGGGCTT GTATTGGATT TGCGTTTTAA CCCCGGCGGT 
CTTTTGGGCG CGGCTGTTGA TATGGCGGGT AAATTTTTAG GTGAAGAAAA ACTTGTTGTA 
TACACGCAAG GCAGACGCCC TATTTACTAT AACGAGTATA AAGCGCCGGT AAAGGCGGAA 
TATAAAGATC TTCCGATGGT GCTTTTGGTT AATGAAGCGT CAGCTTCCGG CAGCGAAATT 
GTGGCCGGCG CGCTGCAAGA CCATAACAGG GCGGTTCTTA TAGGAGCCAG AACATACGGT 
AAAGCAAGCG TGCAGCAGGT GCAGCCCTTG GGGGACGGTT CCGCCATACG TTTGACTATA 
GCGCGTTACT ATACGCCTTT GGGCCGTTTG ATACACCGCA ACCATAAAGA TAAAAATTCC 
AAAGATACCG GCGGCATAGT GCCTGATATT TTAATTAAAC CCGAAGCGGA AGATTTAAAG 
CAAATTTACA CTCTTTATAA TAACGCGGTT CATACTCCAG GTAAAAAAAC AGAGTATGCC 
AATATTAACG ACACCGCTTT AGATAAGGCA AAAGAACTTC TTAAAGACCC TGAAAAATAT 
GAAGATGTTT TACTAAATTC CCCGGCTAAA AAAGAAGCCG AAGAAAAAGT AAAAAATGAG 
GAAGGTAAAA ATTAA

Protein sequence

MKNKINRQAV IIAVVFFLGT LFPYAYSGID NGLQKLKTLV DVIEFVKGNY VEETKFEDLV 
TNAVKGVVNN LDLFSEYLPP KDYKDLKTET KGEFGGVGIR LTQGDGYLEI SSPMPGTPAF 
EAEIMPKDRI THIDKESVAN MTLEEAVEKM RGKIGSKVRL TIMRKKENSE EFETLPDFIL 
KRAKIVPEVV YYRMLEDGIG YIYVIDFSGH TMEKLEQALK SLHKQGMTGL VLDLRFNPGG 
LLGAAVDMAG KFLGEEKLVV YTQGRRPIYY NEYKAPVKAE YKDLPMVLLV NEASASGSEI 
VAGALQDHNR AVLIGARTYG KASVQQVQPL GDGSAIRLTI ARYYTPLGRL IHRNHKDKNS 
KDTGGIVPDI LIKPEAEDLK QIYTLYNNAV HTPGKKTEYA NINDTALDKA KELLKDPEKY 
EDVLLNSPAK KEAEEKVKNE EGKN