Gene TM1040_2337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2337
Symbol
ID	4078327
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2456281
End bp	2457702
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	65%
IMG OID	638007659
Product	microcin-processing peptidase 2
Protein accession	YP_614331
Protein GI	99082177
COG category	[R] General function prediction only
COG ID	[COG0312] Predicted Zn-dependent proteases and their inactivated homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.652541
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATACAA CCGCTTTTTC CCCGTTTGAA ACCACACTTC CCGAAGATGA GGCGCTGCCG 
CTCCTGCGTG ACGCACTGGC AGGTGCCGAC GATGGCGAGA TCTTTGCCGA GCGCACAAAA 
TCAGAGGCAT TGGTATTCGA CGACGGCCGT CTGCGTACGG CGAGCTATGA TGCTGCCGAA 
GGATTCGGGC TGCGCGCGGT GCGGGGCGAA GTGGCGGGGT ATGCCCATTC GACCACCATG 
TCGATCTCGG CGCTGCGCCG CGCGGCCGAA ACCGCACGGC TCGCAGTGGG CGCTGGCGGC 
GGCACCATGG CCCCTGCCCC GCAGGCCACC AATCAGAAAC TCTATGGCGA TCTGGATCCG 
ATCGCGGCGC AGGCCTTTCC CGTGAAGGTC GAGACCCTGC GTGAGATCGA CAGTTTTGCG 
CGCGACCTCG ATCCGCGCGT CGTACAGGTC TCGGCCACGC TGGCAGCATC CTTGCAGGAA 
ATCGAGATCC TGCGCGCCGA TGGCACCCGC GTGCGCGACG TGCGACCGAT GACGCGCGTG 
AATGTCTCGA TCATCGTCGA GGACGGCGGA CGGCGCGAGA GTGGCACTGC GGGCGGTGGC 
GGTCGGGTTG GCCTTGATGG GCTGATCGCG CCCGAGGACT GGCAGGCCAA AGCGCGTGAG 
GCGCTGCGAA TCGCACTGGT GAACCTCGAC GCGGAACCTG CGCCCGCCGG CGAGCTTGAC 
GTGGTACTTG GCCCCGGCTG GCCCGGCATC CTGCTGCACG AGGCGATCGG ACACGGGCTG 
GAGGGCGATT TTAATCGGAA GGGATCCTCG GCATTTGCCG GGCTCATGGG ACAGCGCATC 
GCAGCCCCCG GCGTTACCGT GCTGGACGAT GGCACCATTC CGGACCGGCG CGGTTCGATC 
ACCGTGGACG ACGAGGGCAC GCCAAGCCAG AAGACCACAT TGATCGAGGA CGGCATCCTC 
GTAGGGTACA TGCAGGATCG CCAGAACGCG CGCCTGATGG GCGTGGAGCC CACCGGTAAC 
GGGCGCCGTC AAAGCTATGC ACACGCGCCG ATGCCGCGGA TGACCAACAC CTATATGCTC 
GGCGGTGAGG CGACGCCCGA GGATCTGGTC AAAGAGGTCA AGGACGGAAT CTGGGCCGTC 
GGCTTTGGCG GGGGACAGGT GGATATCACC AACGGCAAAT TCGTATTCTC CTGCACCGAA 
GCCTACCGCG TCAAAGACGG CAAGGTCGGC GCCCCCGTCA AAGGCGCCAC GCTGATCGGA 
GACGGCGCCA CTGCGCTGCA GCAAATCCGC GGGCTCGGCA ATGACATGGC GCTTGACCCC 
GGGATGGGGA ACTGCGGCAA ACAAGGCCAA TGGGTACCTG TCGGCGTGGG CCAGCCCAGC 
GTGCTCATGG GCGGATTGAC GGTCGGCGGA TCTGCGACCT GA

Protein sequence

MDTTAFSPFE TTLPEDEALP LLRDALAGAD DGEIFAERTK SEALVFDDGR LRTASYDAAE 
GFGLRAVRGE VAGYAHSTTM SISALRRAAE TARLAVGAGG GTMAPAPQAT NQKLYGDLDP 
IAAQAFPVKV ETLREIDSFA RDLDPRVVQV SATLAASLQE IEILRADGTR VRDVRPMTRV 
NVSIIVEDGG RRESGTAGGG GRVGLDGLIA PEDWQAKARE ALRIALVNLD AEPAPAGELD 
VVLGPGWPGI LLHEAIGHGL EGDFNRKGSS AFAGLMGQRI AAPGVTVLDD GTIPDRRGSI 
TVDDEGTPSQ KTTLIEDGIL VGYMQDRQNA RLMGVEPTGN GRRQSYAHAP MPRMTNTYML 
GGEATPEDLV KEVKDGIWAV GFGGGQVDIT NGKFVFSCTE AYRVKDGKVG APVKGATLIG 
DGATALQQIR GLGNDMALDP GMGNCGKQGQ WVPVGVGQPS VLMGGLTVGG SAT