Gene SeAg_B3540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B3540
Symbol	degS
ID	6796118
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	3433188
End bp	3434258
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	54%
IMG OID	642777671
Product	serine endoprotease
Protein accession	YP_002148273
Protein GI	197249171
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02038] periplasmic serine pepetdase DegS

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0189154
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGTGA AGCTCTTACG TTCGGTCGCA ATAGGTTTAA TTGTCGGCGC TATTCTGTTG 
GCCGTCATGC CTTCTTTGCG CAAAATTAAT CCTATCGCCG TCCCGCAATT CGACAGTACC 
GATGAGACGC CAGCCAGTTA TAATTTTGCG GTTCGCCGCG CCGCGCCTGC CGTCGTCAAT 
GTCTATAACC GCAGTATGAA CAGTACCGCG CATAATCAAC TGGAGATCCG CACGCTGGGT 
TCCGGCGTGA TCATGGATCA ACGCGGTTAT ATTATTACCA ACAAGCACGT GATTAACGAT 
GCCGATCAGA TTATCGTCGC GCTACAGGAT GGCCGCGTCT TTGAAGCGCT ACTGGTTGGC 
TCCGATTCGC TTACCGATCT GGCGGTGCTG AAGATCAACG CCACTGGCGG GCTGCCTACC 
ATCCCGATTA ATACAAAGCG TACACCGCAT ATTGGCGACG TCGTACTGGC TATCGGCAAC 
CCATATAATC TGGGACAGAC CATCACCCAG GGGATCATCA GCGCAACGGG TCGTATCGGC 
CTGAACCCGA CGGGGCGACA GAATTTTCTC CAGACCGACG CCTCGATTAA CCACGGTAAT 
TCCGGCGGCG CGCTGGTCAA CTCGTTAGGC GAACTGATGG GGATCAACAC CCTCTCTTTT 
GATAAGAGTA ACGATGGCGA AACGCCGGAA GGTCTTGGTT TTGCGATTCC CTTCCAGCTA 
GCCACGAAAA TTATGGATAA GCTTATCCGC GACGGTCGCG TGATTCGCGG CTATATCGGT 
ATTGGCGGAC GAGAAATCGC GCCGCTGCAC GCGCAGCAGG GTAGCGGCAT GGACCCGATT 
CAGGGCATTG TCGTTAATGA AGTGACGCCA AACGGCCCCG CCGCGCTTGC CGGTATTCAG 
GTTAATGATT TGATTATTTC GGTCAATAAT AAACCCGCTG TGTCCGCGCT GGAGACGATG 
GATCAGGTGG CGGAAATCCG CCCGGGCTCC GTCATTCCGG TCGTGGTAAT GCGGGATGAT 
AAGCAGCTCA CGTTCCAGGT GACGGTGCAG GAATACCCGG CGTCGAACTA A

Protein sequence

MFVKLLRSVA IGLIVGAILL AVMPSLRKIN PIAVPQFDST DETPASYNFA VRRAAPAVVN 
VYNRSMNSTA HNQLEIRTLG SGVIMDQRGY IITNKHVIND ADQIIVALQD GRVFEALLVG 
SDSLTDLAVL KINATGGLPT IPINTKRTPH IGDVVLAIGN PYNLGQTITQ GIISATGRIG 
LNPTGRQNFL QTDASINHGN SGGALVNSLG ELMGINTLSF DKSNDGETPE GLGFAIPFQL 
ATKIMDKLIR DGRVIRGYIG IGGREIAPLH AQQGSGMDPI QGIVVNEVTP NGPAALAGIQ 
VNDLIISVNN KPAVSALETM DQVAEIRPGS VIPVVVMRDD KQLTFQVTVQ EYPASN