Gene B21_03046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	B21_03046
Symbol	degS
ID	8114499
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21
Kingdom	Bacteria
Replicon accession	NC_012892
Strand	+
Start bp	3242570
End bp	3243637
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	53%
IMG OID	644849231
Product	hypothetical protein
Protein accession	YP_003000804
Protein GI	251786500
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02038] periplasmic serine pepetdase DegS

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.82301
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGTGA AGCTCTTACG TTCCGTTGCG ATTGGATTAA TTGTCGGCGC TATTCTGCTG 
GTTGCCATGC CTTCGCTGCG CAGCCTTAAC CCGCTTTCCA CTCCGCAATT TGACAGTACC 
GATGAGACGC CTGCCAGCTA TAATCTGGCG GTTCGCCGCG CCGCGCCAGC GGTGGTTAAC 
GTTTACAACC GTGGTTTGAA CACCAACTCT CACAACCAGC TTGAGATCCG CACCCTGGGA 
TCCGGTGTAA TCATGGATCA ACGCGGTTAT ATCATCACCA ATAAACACGT CATCAACGAC 
GCCGATCAGA TCATCGTCGC CTTACAGGAT GGTCGTGTAT TTGAAGCATT GCTGGTGGGA 
TCTGACTCTC TAACCGATCT GGCGGTACTT AAAATTAATG CCACTGGCGG TTTACCTACC 
ATTCCAATTA ATGCACGTCG CGTACCGCAC ATTGGCGACG TAGTACTGGC GATCGGTAAC 
CCGTACAACC TCGGGCAGAC CATTACCCAG GGGATTATTA GTGCCACGGG TCGAATCGGT 
CTGAACCCGA CCGGGCGGCA AAACTTCCTA CAAACCGATG CTTCCATTAA CCACGGTAAC 
TCTGGCGGCG CGCTGGTGAA CTCGCTGGGA GAACTGATGG GCATTAACAC GCTGTCGTTT 
GATAAGAGTA ACGATGGCGA AACGCCGGAA GGTATCGGCT TTGCGATTCC TTTCCAGTTA 
GCAACCAAAA TTATGGATAA GCTGATCCGC GATGGTCGCG TGATCCGCGG CTACATTGGT 
ATCGGCGGAC GCGAGATCGC ACCACTGCAC GCACAGAGCG GTGGTATAGA TCAACTGCAA 
GGGATCGTGG TTAATGAAGT GTCACCTGAC GGCCCAGCGG CGAATGCGGG TATTCAGGTC 
AACGATCTGA TTATTTCGGT GGATAACAAA CCGGCCATCT CTGCTCTGGA GACGATGGAT 
CAGGTGGCGG AAATTCGCCC TGGTTCGGTG ATCCCGGTTG TAGTGATGCG TGATGATAAG 
CAGTTAACGC TGCAGGTCAC CATTCAGGAA TATCCGGCAA CCAATTAA

Protein sequence

MFVKLLRSVA IGLIVGAILL VAMPSLRSLN PLSTPQFDST DETPASYNLA VRRAAPAVVN 
VYNRGLNTNS HNQLEIRTLG SGVIMDQRGY IITNKHVIND ADQIIVALQD GRVFEALLVG 
SDSLTDLAVL KINATGGLPT IPINARRVPH IGDVVLAIGN PYNLGQTITQ GIISATGRIG 
LNPTGRQNFL QTDASINHGN SGGALVNSLG ELMGINTLSF DKSNDGETPE GIGFAIPFQL 
ATKIMDKLIR DGRVIRGYIG IGGREIAPLH AQSGGIDQLQ GIVVNEVSPD GPAANAGIQV 
NDLIISVDNK PAISALETMD QVAEIRPGSV IPVVVMRDDK QLTLQVTIQE YPATN