Gene SO_0047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SO_0047
Symbol
ID	1167946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella oneidensis MR-1
Kingdom	Bacteria
Replicon accession	NC_004347
Strand	-
Start bp	53199
End bp	54407
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	46%
IMG OID	637342061
Product	carboxyl-terminal protease, putative
Protein accession	NP_715689
Protein GI	24371647
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0793] Periplasmic protease
TIGRFAM ID	[TIGR00225] C-terminal peptidase (prc)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACATC TACTCCGCAA TATCGCCAGT CTTGGACTCG GCCTAAGCTT AGGCCTGTCT 
ATTAGCCTAT CCAGTCAAGA GAATACCAAG TCGTATCGAA GTGACTTTGA TTACCCGCTA 
TTGCAGGATG TGCTCGAAAC GGTCGAAACC TATTACGTTA AAACTGTGAC TAAGGATGAG 
CTTGTTCAAG CGGCAATTAA AGGCATCTTT GAGCATTTAG ATCCCTATTC AAGCTTTCTA 
AATCACCAAG AATTACTCGA TCTAAAAGAT TCAAATCGGG GTGAGTACTT CGGCTTTGGC 
TTTGAAGTCG CCAGCGAAAA AGACCATATC AGCATCATTG CCCCCTTTGC GAACTCCCCA 
GCCGAACAGG CTGGGATTCA AGCCGGTGAC ATCATTATCA AGCTGAATAA CACCCCCACG 
ACAGAAACTA ACCTTGCGGA TATTCTTAAC CAAATCAAGC AACACAGTTT GAGTCATCAA 
AGTATTCGCC TCACGCTAAA ACACCGTAAT GACGAAGCAG AATTTGAGGT GATGTTAAAA 
CCTAGCACAA TCACAATTCA GTCGGTCGCG AGCAAATTAT TGGATGGGAA CATTGGCTAC 
GTAAGGCTCA GCAGCTTTCA AGAAGACTCT ACCGAAGATA TGGTACGCAC CCTGAGCCAA 
TGGCAAGGCA CTCAGTTAAC GGGCTTGATA TTGGACCTAC GCAATAATCC CGGCGGCCTG 
CTCGATCAGG CAATTAATAT TGCCGACCTC TTTTTGGCAA AAGGGCGAAT CGTCTCCACC 
TCTGGCCGTT TTTTTGATGC CAATTCAGAC TATTACGCCT CACCGCAAAC CATGCTCGCC 
AACGTACCCA TGCTAGTGCT AATCAATAAA GGCTCCGCAT CAGCATCAGA AGTACTGGCC 
GCCGCATTGC AAGAAAATGG CCGGGCAAAA CTCCTAGGCG AAACCAGCTT TGGTAAAGGA 
ACAGTGCAAA GCCTTATTCC TATTCTTAAC AACGGCAATG CGGTCAAACT GACCATAGCC 
CAGTACAACA CGCCTAAAGG GGAGAATATC CACGACATAG GGATTAAGCC CGACATCAAA 
GTAGTCTCCG AAACTGGCTC CAATCAAAAG AATATGCCTA TAATCGACGC TATCTCTGCA 
CGAACCGATG TCAGCCAAGA CACGATTGTC ACTTCAGCTA TCACTTGGAT GCAACATCAT 
GACGAATAA

Protein sequence

MKHLLRNIAS LGLGLSLGLS ISLSSQENTK SYRSDFDYPL LQDVLETVET YYVKTVTKDE 
LVQAAIKGIF EHLDPYSSFL NHQELLDLKD SNRGEYFGFG FEVASEKDHI SIIAPFANSP 
AEQAGIQAGD IIIKLNNTPT TETNLADILN QIKQHSLSHQ SIRLTLKHRN DEAEFEVMLK 
PSTITIQSVA SKLLDGNIGY VRLSSFQEDS TEDMVRTLSQ WQGTQLTGLI LDLRNNPGGL 
LDQAINIADL FLAKGRIVST SGRFFDANSD YYASPQTMLA NVPMLVLINK GSASASEVLA 
AALQENGRAK LLGETSFGKG TVQSLIPILN NGNAVKLTIA QYNTPKGENI HDIGIKPDIK 
VVSETGSNQK NMPIIDAISA RTDVSQDTIV TSAITWMQHH DE