Gene SbBS512_E3541 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3541
Symbol	degS
ID	6273214
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	3292775
End bp	3293842
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	52%
IMG OID	641727412
Product	serine endoprotease
Protein accession	YP_001881858
Protein GI	187731547
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02038] periplasmic serine pepetdase DegS

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	0.360038
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGTGA AGCTCTTACG TTCCGTTGCG ATTGGATTAA TTGTCGGCGC TATTCTGCTG 
GTTGCCATGC CTTCGCTGCG CAGCCTTAAC CCGCTTTCCA CTCCGCAATT TGACAGTACC 
GATGAGACGC CTGCCAGCTA TAATCTGGCG GTTCGCCGCG CCGCGCCAGC GGTGGTTAAC 
GTTTACAACC GTGGTGTGAA CACCAACTCT CACAACCAGC TTGAGATCCG CACCCTGGGA 
TCCGGTGTAA TCATGGATCA ACGCGGTTAT ATCATCACCA ATAAACACGT CATCAACGAC 
GCCGATCAGA TCATCGTCGC CTTACAGGAT GGACGTGTAT TTGAAGCATT GCTGGTGGGA 
TCTGACTCTC TAACCGATCT GGCGGTACTT AAAATTAATG CCACTGGCGG TTTACCTACC 
ATTCCAATTA ATGCACGTCG CGTACCGCAC ATTGGCGACG TAGTACTGGC GATCGGTAAC 
CCGTACAACC TCGGGCAGAC CATTACCCAA GGGATTATTA GTGCCACGGG TCGAATCGGT 
CTGAACCCTA CCGGGCGGCA AAACTTCCTA CAAACCGATG CTTCCATTAA CCACGGTAAC 
TCTGGTGGCG CGCTGGTGAA CTCGCTGGGA GAACTGATGG GCATTAACAC GCTGTCGTTT 
GATAAGAGTA ACGATGGCGA AACGCCGGAA GGTATCGGCT TTGCGATTCC TTTCCAGTTA 
GCAACCAAAA TTATGGATAA GCTGATCCGC GATGGGCGCG TGATCCGCGG CTACATTGGC 
ATTGGTGGAC GTGAGATCGC ACCACTGCAC GCGCAGAGCG GTGGTATAGA TCAACTGCAA 
GGGATCGTGG TTAATGAAGT GTCACCTGAC GGCCCGGCGG CGAATGCGGG TATTCAGGTC 
AACGATCTGA TTATTTCGGT GGATAACAAA CCGGCCATCT CTGCTCTGGA GACGATGGAT 
CAGGTGGCAG AAATTCGCCC TGGTTCGGTG ATCCCGGTTG TAGTGATGCG TGATGATAAG 
CAGTTAACGC TGCAGGTCAC CATTCAGGAA TATCCGGCAA CCAATTAA

Protein sequence

MFVKLLRSVA IGLIVGAILL VAMPSLRSLN PLSTPQFDST DETPASYNLA VRRAAPAVVN 
VYNRGVNTNS HNQLEIRTLG SGVIMDQRGY IITNKHVIND ADQIIVALQD GRVFEALLVG 
SDSLTDLAVL KINATGGLPT IPINARRVPH IGDVVLAIGN PYNLGQTITQ GIISATGRIG 
LNPTGRQNFL QTDASINHGN SGGALVNSLG ELMGINTLSF DKSNDGETPE GIGFAIPFQL 
ATKIMDKLIR DGRVIRGYIG IGGREIAPLH AQSGGIDQLQ GIVVNEVSPD GPAANAGIQV 
NDLIISVDNK PAISALETMD QVAEIRPGSV IPVVVMRDDK QLTLQVTIQE YPATN