Gene Spro_2119 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Spro_2119
Symbol
ID	5606137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Serratia proteamaculans 568
Kingdom	Bacteria
Replicon accession	NC_009832
Strand	+
Start bp	2313038
End bp	2315074
Gene Length	2037 bp
Protein Length	678 aa
Translation table	11
GC content	57%
IMG OID	640937655
Product	carboxy-terminal protease
Protein accession	YP_001478348
Protein GI	157370359
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000159277
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000525254
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACAAAT TTGTCAGATT AACAGCAGTC GCGGGTCTGT TGTGGGCGGG TGTCAGTTAC 
GGAGCGGAAC CAGCCAACAT CCGCATCGAT CAACTGCCTC AGCTGCAGCA GGAACCGCAA 
CATGCAACTG TGAGTGAGCG CGTAACTTCG CGCTTCACTC GCTCTCATTA CCGTCAGTTT 
TCCCTCGACG CGGACTTTTC AGGCAAGATC TTCGATCGTT ATCTGAATAT GCTGGACTAC 
AGCCATAACG TGCTGCTGGC CTCCGACGTG GCGCAATTCG CCAACAAGCG CAATCAGCTG 
GGCGAAGAAC TGAAAAGCGG TAAGCTCGAT ACGCCATACG CGCTGTACAA TCTGGCGCAG 
AAACGCCGTT TTGAGCGTTA CACCTATGCA TTGTCGCTGC TGGAAAAGCC AATGAGCTTC 
ACCGGCAACG ACACTATTGA TCTCGACCGC AGCAAAGCGC CGTGGCCGAA AGACAAGGCC 
GAACTGGACG CGCTGTGGAA TGCGAAAGTC AAATATGACG AGCTGAACCT CAAGCTGACC 
GGCAAGACCG ACAAGGAAAT TCGTGAAACG CTGACCAAGC GCTATCAGTT TGCCATCAAG 
CGCCTGACGC AAAGCAACAG CGAAGACGTT TTCCAACTGG CGATGAATGC CTTTGCGCAT 
GAAATCGACC CGCATACCAA CTATCTCTCC CCACGCAATA CCGAACAGTT CAATACCGAG 
ATGAGCCTGT CGCTGGAAGG TATCGGTGCG GTGTTGCAGA TGGATGACGA TTACACCCTG 
ATCAACTCCA TGGTGCCAGG TGGCCCGGCG GCGAAGAGCA AGGCGATCAC CGTGGGTGAC 
CGTATTGTCG GCGTTGGCCA GGCGGGCAAG CCTGTGGTCG ATGTGATCGG CTGGCGTCTG 
GACGACGTGG TTTCCCTGAT TAAAGGGCCG AAGGGCAGCA AGGTGCGCCT GGAGATCCTG 
CCGGCCGGCA AGGGCACTAA AACCCGAGTG GTCACCTTGA CCCGTGAGCG TATCCGTCTG 
GAAGACCGCG CGGTGAAAAT GACCATCAAG ACCGTCGGCA AAGAGAAAGT CGCGGTGATG 
GACATTCCGG GCTTCTACGT GGGCCTGACC GATGACGTGA AAGTTCAGTT GCAGAAGATG 
GCCAAGCAGA ACGTCAAGAG CCTGATCATC GACCTGCGCA CTAACGGCGG CGGCGCACTG 
ACCGAAGCGG TTTCGCTGTC CGGTCTGTTC ATTCCGAGCG GCCCGGTAGT GCAGGTACGT 
GACAACAACG GTAAAGTGCG TGAAGACGCG GACACCGACG GCGTGACCTA TTACAAGGGG 
CCGCTGGTGG TACTGGTTGA CCGTTTCAGC GCCTCGGCTT CGGAGATCTT CGCCGCGGCA 
ATGCAGGACT ATGGTCGCGC GCTGATCGTC GGTGAACCGA CCTTCGGGAA AGGCACCGTG 
CAGCAGTATC GCTCGCTGAA CCGCATTTAC GATCAGATGC TGCGTCCGGA GTGGCCGGCG 
TTGGGGTCGG TGCAATACAC CATACAGAAG TTCTACCGCG TTAACGGCGG CAGTACCCAA 
CGTAAGGGGG TTACCCCGGA TATCCTGATG CCGAGCGGCA TTGATCCGGC GGAAACCGGT 
GAAGCGTTTG AAGATAACGC TATGCCGTGG GACAGCATCA ATGCGGCGAC CTACACCAAA 
ACCGGTGACA TGAAGCCGTT TGAGCCTGAA CTGCTGAAGG ATCATGAGCA GCGTATCGCC 
AAGGATCCCG AGTTCCAGTA CATCGCGCAG GATATCGCTC ATTACAAGGC GCTGAAGGAC 
AAGCGTAACA TCGTCTCTCT CAACCTGGTT CAGCGCGAGA AAGAGAACCA CGATGATGAC 
GCTACCCGTC TGCAACGTGT TAATGATCGC CTGCAGCGCG CCGGTAAAAA GCCGCTGAAG 
GCCCTGGAAG ATTTGCCGAA GGATTACCAG GAACCTGACC CATATCTGGA TGAAACCGTG 
CACATCGCAC TGGATCTGGC GCACCTTGAT CAGGCGCAGC CGGCGGCGGC GAAATAA

Protein sequence

MNKFVRLTAV AGLLWAGVSY GAEPANIRID QLPQLQQEPQ HATVSERVTS RFTRSHYRQF 
SLDADFSGKI FDRYLNMLDY SHNVLLASDV AQFANKRNQL GEELKSGKLD TPYALYNLAQ 
KRRFERYTYA LSLLEKPMSF TGNDTIDLDR SKAPWPKDKA ELDALWNAKV KYDELNLKLT 
GKTDKEIRET LTKRYQFAIK RLTQSNSEDV FQLAMNAFAH EIDPHTNYLS PRNTEQFNTE 
MSLSLEGIGA VLQMDDDYTL INSMVPGGPA AKSKAITVGD RIVGVGQAGK PVVDVIGWRL 
DDVVSLIKGP KGSKVRLEIL PAGKGTKTRV VTLTRERIRL EDRAVKMTIK TVGKEKVAVM 
DIPGFYVGLT DDVKVQLQKM AKQNVKSLII DLRTNGGGAL TEAVSLSGLF IPSGPVVQVR 
DNNGKVREDA DTDGVTYYKG PLVVLVDRFS ASASEIFAAA MQDYGRALIV GEPTFGKGTV 
QQYRSLNRIY DQMLRPEWPA LGSVQYTIQK FYRVNGGSTQ RKGVTPDILM PSGIDPAETG 
EAFEDNAMPW DSINAATYTK TGDMKPFEPE LLKDHEQRIA KDPEFQYIAQ DIAHYKALKD 
KRNIVSLNLV QREKENHDDD ATRLQRVNDR LQRAGKKPLK ALEDLPKDYQ EPDPYLDETV 
HIALDLAHLD QAQPAAAK