Gene Mesil_1420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mesil_1420
Symbol
ID	9250920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Meiothermus silvanus DSM 9946
Kingdom	Bacteria
Replicon accession	NC_014212
Strand	-
Start bp	1412743
End bp	1414065
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	61%
IMG OID
Product	carboxyl-terminal protease
Protein accession	YP_003684821
Protein GI	297565849
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAAAA GAGCTTGGAT CATTATCGGC GGGGCCGTAG TGGCGGCCCT GGTATACGCC 
CAACTCAACC GCGGAGGGGC CGAAAGCTTC TCCCGCAACC CCAACGGTCA GGCCCTGATC 
GAAACCTACT CGCTCCTCCA AGACCAGTAC CTGAAACCCC TGGACCAAAC CCAGCTCAAC 
AAGGTGCTCG AGGGGGGGAT CCGGGGGATG CTGAATGCCC TGGGCGACGA GTTCACCAGC 
TACTCGCCCC CCGCCAGGGC TGCGCAGCGG CAAGAAGACC TACGCGGGGA ATTCTTCGGC 
ATTGGGGCCA CTTTGGCTCC AGCTCAGCAA GGGGGCACCG GGGCCCAAAT CCAAGGCCTC 
ATCCGGGGCT TGCCCGCCTT CAACGCTGGC CTGCGGGTAG GCGACCAGAT CGTGGAGGTC 
AACGGCGAGG ACGTGACCAA GCTGGACCTC GAGGAAATAG TCTCCAAGAT CCGCGGTCCG 
CGAGGGACCA AGGTCACCAT AGGGGTCAAG CGCGAGGGCA ACAACGCGGT TTTGCGTTTT 
GAACTCATTC GCGAGCTGGT GAAGATCATC GAGGTGAACA AGGCGTTGCT TCCGGACAAC 
ATCGGCTACA TCGAGCTGCG CTCGTTCGCC AATATCAATG TATCTTCCCA GCTCAACGCG 
GCCATCAGCG ACCTGCGCAA ACAGGGAATG CAAAAGCTTA TCTTCGACCT GCGTGACAAC 
GGCGGGGGTC TTTTGGATCA GGGCTGCTCC GTGGCCAAGG CCTTCATAAA GGAAGGACCT 
ATCGTCTACA CCAAGACCCG CAGCGAGACC CGCTTGTACT GCGAAGCCAA CGGGCAGGTG 
CAGTGGAGTG GACCGATGGT GGTACTGGTC AACGGGAACT CGGCCTCGGC CTCGGAGATC 
GTGGCGGGGG CTCTGCAGGA CACCGGTCGG GCCAAGATCG TGGGGGAGAA GACCTTCGGT 
AAAGGGGTAG GTCAGAACGT GATTGACCTG GCCAACGGCG GCGACCTGAC CCTGGTGACC 
TTCCAGTGGC TCACTCCCAA GAAGCGGGCC ATCACCCGCG ATCAGGGCAT CCAGCCCGAT 
GTGGTGGTGC GGGATAACCG CTTCCCGGTA CCGGTCTCGT TCGAGGGCAC CGGCGCCAAG 
CCAGGGGCTA CGGTAACGCT CACCATAGAC GGGAAAACCT ATACCGCCAA GGCTGATGAA 
ACCGGCAAGT ATGCCTTCAG CCAGCCACTA CCGGCCCGCC CAGCCAACGA TAACTCCGGC 
AACGCAATGG TGGATCCGCA AAACGACGCC ATCCTGGCTC GAGCCCTGCA AGAGCTTAAG 
TAA

Protein sequence

MKKRAWIIIG GAVVAALVYA QLNRGGAESF SRNPNGQALI ETYSLLQDQY LKPLDQTQLN 
KVLEGGIRGM LNALGDEFTS YSPPARAAQR QEDLRGEFFG IGATLAPAQQ GGTGAQIQGL 
IRGLPAFNAG LRVGDQIVEV NGEDVTKLDL EEIVSKIRGP RGTKVTIGVK REGNNAVLRF 
ELIRELVKII EVNKALLPDN IGYIELRSFA NINVSSQLNA AISDLRKQGM QKLIFDLRDN 
GGGLLDQGCS VAKAFIKEGP IVYTKTRSET RLYCEANGQV QWSGPMVVLV NGNSASASEI 
VAGALQDTGR AKIVGEKTFG KGVGQNVIDL ANGGDLTLVT FQWLTPKKRA ITRDQGIQPD 
VVVRDNRFPV PVSFEGTGAK PGATVTLTID GKTYTAKADE TGKYAFSQPL PARPANDNSG 
NAMVDPQNDA ILARALQELK