Gene Emin_1216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Emin_1216
Symbol
ID	6263717
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Elusimicrobium minutum Pei191
Kingdom	Bacteria
Replicon accession	NC_010644
Strand	-
Start bp	1315581
End bp	1316609
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	44%
IMG OID	642611694
Product	glycoprotease family metalloendopeptidase
Protein accession	YP_001876103
Protein GI	187251621
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0533] Metal-dependent proteases with possible chaperone activity
TIGRFAM ID	[TIGR00329] metallohydrolase, glycoprotease/Kae1 family

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.0159819
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCG ATAAAGATAT AACAATTTTA GGTATAGAAA CCACATGTGA CGAAACTTCC 
GCCGCCATAC TTAAAAGCGG GCGGGATTTA GTTTCTAACG TGGTGCACAC CCAAATCGAT 
ATACATAAAA AATATTGCGG CGTAGTGCCC GAACTCGCCA GCCGCGCCCA TGCGGTTAAA 
GTGGCAGAAG TGGTAAAAGA AGCGCTTGGT AACCATAAAA TAGATTTAGT AGCTTTCGCA 
AGCGGCCCCG GTTTGCCCGG CGGTCTTATG GTAGGCAGAG TAGCTGCGGA AGCAGTGTCC 
GCTTTAAAAA ATGTTCCTAT AATAGGAGTA AACCATTTGG AAGGACATTT GTTTGCCTGT 
GAATTTGACG CTAAAGAAGG GAAAATAGCA GCCGATAAAC AACTTAAATT TCCTTTAATA 
GCTTTAATAG TTTCCGGCGG ACATACCGAA CTTTGGTACG TAAAAAATTA CGGCGATTAT 
AAAATGCTGG GACGCACAAG GGACGACGCT GCGGGCGAAG CTTTTGACAA AGTGGCTAAA 
CTTTTGGGGC TTGGTTATCC GGGCGGGCCT GTTGTCGCTA AAGAGGCTTT AAAAGGAAAC 
CCAGAGGCTA TTAAATTCCC AAGACCGATG ATGAAGGGAA CTTTTGAATT TTCTTTCAGC 
GGTATTAAAA CAGCTGTAAG CTATTACCTG CGCGACCATA AAGATATAAA AAAAGAAGAT 
GTGTGCGCTT CTTTCCAGGC GGCGATGGTG GAAACTCTTG TGGCTAAAAC TTTCCAGGCT 
GTAAAAAAAT ATAAAGTTAA AAATGTGGCT GTCGGCGGCG GCGTCGCGGC TAATGAACTT 
TTAAAAGAAA GCATGGTAAA ACGCGGTCAG AAGGAAGGAG TGGATGTTTC TTTCGTACCG 
AGGGCGCTCT CTTCCGATAA CGGCGCCATG ATTGCCCTTG CCGGATATAA AAAATTTATG 
TTTGCCGGTA AGTTTAACGC TAATATTAGA ATCAACCCTA ACATGAGAAT TAAAAACTGG 
GGGAAATAA

Protein sequence

MKTDKDITIL GIETTCDETS AAILKSGRDL VSNVVHTQID IHKKYCGVVP ELASRAHAVK 
VAEVVKEALG NHKIDLVAFA SGPGLPGGLM VGRVAAEAVS ALKNVPIIGV NHLEGHLFAC 
EFDAKEGKIA ADKQLKFPLI ALIVSGGHTE LWYVKNYGDY KMLGRTRDDA AGEAFDKVAK 
LLGLGYPGGP VVAKEALKGN PEAIKFPRPM MKGTFEFSFS GIKTAVSYYL RDHKDIKKED 
VCASFQAAMV ETLVAKTFQA VKKYKVKNVA VGGGVAANEL LKESMVKRGQ KEGVDVSFVP 
RALSSDNGAM IALAGYKKFM FAGKFNANIR INPNMRIKNW GK