Gene Spro_3601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_3601
Symbol
ID	5605848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	3980822
End bp	3981847
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	58%
IMG OID	640939152
Product	peptidase M4 thermolysin
Protein accession	YP_001479825
Protein GI	157371836
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3227] Zinc metalloprotease (elastase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.238334
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.290182
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGACCC TGACAGCGCG TTCGGTCATT CCCCCTTATA TGCTGCGTCG GATCATTGAG 
CACGGCAGCC TGCTGCAGCG CGACTGCGCA TTACACACCC TTAACCACGT TCAAAGCCTG 
CTCGGCAACA AGCCGTTACG CGCCCCCGGG GCGAAAACCT CGACCGGTGG CGAAGTCATC 
CGCGATATTT TTGATGCCGA AAACGGCACC CAACTGCCGG GTAAACAGGT GCGTAATGAG 
GGCCAGGCCA GTAATCATGA CGTGGCGGTG GATGAAGCCT ATGACTACCT CGGCGTCACC 
TACGATTTCT TCTGGCAGGC ATTCAAACGC AACTCGCTGG ACAATCAAGG CCTGCCGCTG 
ACCGGCAGCG TGCATTACGG CAAGGAATAC CAGAACGCCT TTTGGAACGG CCAGCAAATG 
GTCTTCGGCG ATGGTGACGG CGAAATCTTT AACCGTTTTA CCATCGCCAT CGACGTGGTT 
GGCCACGAAC TGGCACACGG CGTCACCGAA AGCGAGGCCG GACTAATTTA CTTCCAACAG 
GCCGGTGCGC TGAATGAGTC GCTGTCTGAC GTGTTCGGTT CTCTGGTCAA ACAGTTCCAC 
CTCAAGCAAA CCGCGGATAA GGCCGACTGG CTGATTGGCG AAGGCCTGCT GGCGAAAGGC 
ATCAACGGCA AGGGCCTGCG TTCGATGTCG GCACCCGGTA CCGCCTACAA CGATCCGCTG 
CTGGGGAAAG ATCCGCAGCC GGCCGACATG AAAGACTACA TTCAGACCAA AGAGGATAAC 
GGCGGCGTCC ACCTCAACTC CGGCATTCCC AACCGCGCCT TCTATCTGGC GGCCACGGCT 
CTGGGCGGCT TTGCCTGGGA GAAAGCCGGT TACATCTGGT ACGACACGCT TTGCGACAAG 
ACACTGCCGC AGGACGCTGA CTTCGCCACC TTTGCCCGTA CCACGGTGAA ACATGCCAAA 
CAGCGCTTCG ACAGTAAAGT GGCGGATAAG GTACAGCAGG CCTGGCATCA GGTAGGGGTG 
GCGTAA

Protein sequence

MPTLTARSVI PPYMLRRIIE HGSLLQRDCA LHTLNHVQSL LGNKPLRAPG AKTSTGGEVI 
RDIFDAENGT QLPGKQVRNE GQASNHDVAV DEAYDYLGVT YDFFWQAFKR NSLDNQGLPL 
TGSVHYGKEY QNAFWNGQQM VFGDGDGEIF NRFTIAIDVV GHELAHGVTE SEAGLIYFQQ 
AGALNESLSD VFGSLVKQFH LKQTADKADW LIGEGLLAKG INGKGLRSMS APGTAYNDPL 
LGKDPQPADM KDYIQTKEDN GGVHLNSGIP NRAFYLAATA LGGFAWEKAG YIWYDTLCDK 
TLPQDADFAT FARTTVKHAK QRFDSKVADK VQQAWHQVGV A