Gene Emin_0689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_0689
Symbol
ID	6263202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	762301
End bp	763431
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	42%
IMG OID	642611161
Product	peptidase M50
Protein accession	YP_001875581
Protein GI	187251099
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0750] Predicted membrane-associated Zn-dependent proteases 1
TIGRFAM ID	[TIGR00054] RIP metalloprotease RseP

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000148024
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	3.25567e-17
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTGCGT TTAGTTTAAA AGGGGTAATT ACGGCAGCCG CGTTTCTTGT GGCCTTAAGC 
CCGATAGTTT TAATCCATGA ATTCGGACAT TTTATAGTAT GCAGGCTTGT GGGTATAAGA 
GTTTTGGAAT TTTCTTTCGG TTTCGGCAAG GTTTTGTGGT CAACAAAAAA AGGGCATACC 
CAGTATTCCA TAAGAGCAAT ACCCTTCGGT GGGTTTGTTA ACCCCGCGGG CGAGATGTTT 
GTTGACAATA AAGACGGCAA AAACACCCCT AAAGATTATG AATTCGCCTC AAAATCATGG 
TGGAAAAAAC TTCTTATGGT TATAAGCGGC GCGCTTATGA ATTATGTGTT GGCTTTTATA 
GTTTTTACTT CCCTTGTTTT TGTTACGGGC GTTCCCGTAA CGGACAGCAA AGCCACGCCC 
GCCGTTTTGG GTGAGGTTGT GGCCAATTAC CCCGCGCAAA AACACGGCCT TGAAGCGCAG 
GATAAAATTT TAAAAATTAA TGAAACTCCC GTTAATAATT GGCAAGATGT TTTAAATTCG 
GTAGCCTCAC TTAATACGGA CCTTAACCTT AAATATGAAA GAAACGGCGA AATAAGAAGC 
CTTACTATAC CTTTTTCCGA TTTTAATAAA GATAACCCAA AATTGGGCAT TGCCGTGCAG 
ACGCTTTATA CAAGCGCAAC TCCGCTGCAG GCGTTTAGAA GCGGCCTTTA CCAATGCTGG 
TTTTGGACTA AGTTGTCTTT AACGGAACTT TACAAAGCCG TGTCAAAAAC AAAAAAATTA 
GAAGTAGCGG GGCCTATAGG CATTTTTCAC CGCGTGCACC AGGCTACACA AAACGGCTGG 
ATGGATTTTG TTTGGTTAAT AGGTTTGTTA AGTTTAGCCG TGGGCATGTT TAACTTATTT 
CCGATACCGG TACTTGACGG CGGTTACGCC GTGGTATTTA TATGGGAAGG CATAACCGGT 
AAACTGCCTT CCGTAAAAGT GGTAAACATA GCGTTAAATG TGGGCTTAGC TCTTTTACTA 
ATGCTTGTTT TGTACGCTTC CGTTTTTGAC GTTAAAAGAA TTTTTATAAA ACAGTCTTCT 
GACTCCCCTG CGGTTGTTGA AACGGTTGAA CCGGCAGAAA ATTCTAAATA A

Protein sequence

MIAFSLKGVI TAAAFLVALS PIVLIHEFGH FIVCRLVGIR VLEFSFGFGK VLWSTKKGHT 
QYSIRAIPFG GFVNPAGEMF VDNKDGKNTP KDYEFASKSW WKKLLMVISG ALMNYVLAFI 
VFTSLVFVTG VPVTDSKATP AVLGEVVANY PAQKHGLEAQ DKILKINETP VNNWQDVLNS 
VASLNTDLNL KYERNGEIRS LTIPFSDFNK DNPKLGIAVQ TLYTSATPLQ AFRSGLYQCW 
FWTKLSLTEL YKAVSKTKKL EVAGPIGIFH RVHQATQNGW MDFVWLIGLL SLAVGMFNLF 
PIPVLDGGYA VVFIWEGITG KLPSVKVVNI ALNVGLALLL MLVLYASVFD VKRIFIKQSS 
DSPAVVETVE PAENSK