Gene BBta_3032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_3032
Symbol	degP
ID	5156163
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	-
Start bp	3168096
End bp	3169193
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	68%
IMG OID	640557904
Product	Serine protease do-like precursor
Protein accession	YP_001239058
Protein GI	148254473
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	0.722688
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGATTC TGCGTTGTGT CCGGCCTTTG GTTCTGCTGC CGGCGATCGT GCTCTCCCTC 
CTGGCTGCCC CTGCCCTCGC CCAGATCCCG GACCTCAAGC TCGGCCGCGT GCCGACCTTG 
GCGCCACTGG TCAAGGAGGT CACCCCGGCC GTCGTCAACA TCTCGGTCGA AGGCAAGGTC 
CGGCAGGACA ATCCGCTGTA CCAGGACCCG CTGTTCCGCG AGTTCTTCGA CGTTCCGAAA 
CAGGTCGAGA AGCAGATCAG CGCCACCGGC TCCGGCGTCA TCGTCGATGC GCAGCGCGGC 
TACGTGATGA CCGCCAATCA CGTCGTCGAG CATGTCAGCA CCGCACAAAT CCGGACCAAG 
GACGGCCGCA AATTCTCCGC CCGCCTGGTC GGGCGCGATC CCGCCACCGA CATCGCGGTG 
CTGCAGATCA AGGATCCGAC CGAGCTCAAG GCGATCGCGC TTGGCGACAG CGATGCGCTC 
GAGGTCGGCG ACTTCGTGAT CGCGGTCGGC AACCCGTTCG GCCTCGGACA GACCGTCACC 
TCCGGCCTCG TCAGCGCGCT CGGGCGAACC GGGCTCGGCA AGCAGGGCTA TGAGGATTTC 
ATCCAGACCG ACGCCGCGAT CAATCCCGGC AATTCAGGCG GGGCGCTGAT CAACCTCCGC 
GGCGAACTGG TCGGCATCAA CACCGCGATC ATCTCGCCGG GCGGCGGCAA TGTCGGCATC 
GGCTTTGCCG TGCCGATCAA CATGGCGCGA CGGGTGATGG AGCAACTGGT CGCCAACGGC 
CGCGTCGACC GCGGACGCAT CGGGGTCACC CTGCTCGATC TGGATTCGCC GGCCGATGGC 
CGCGTCCAGG GCGCCCGCGT CGCCGATGTG ACCGTCGGCT CCCCGGCCGA GCGGGCCGGA 
CTGCGCAAGG GCGACATCAT CGTGAAGGCG AACGACATGC CGGTGCGCAG CGCGACGCAG 
GTTCGCAATC TCATCGGGCT GACGCCGGTC GGCCAACGCG TCCGCCTCGT GTTCGAGCGC 
GACCGCGCGC TCGGCAATGC GACGGTCGAG GTCGCGCCGG TTACCGAAGA ACGCGCCCGC 
GCGCGAAGCT CGGGCTGA

Protein sequence

MQILRCVRPL VLLPAIVLSL LAAPALAQIP DLKLGRVPTL APLVKEVTPA VVNISVEGKV 
RQDNPLYQDP LFREFFDVPK QVEKQISATG SGVIVDAQRG YVMTANHVVE HVSTAQIRTK 
DGRKFSARLV GRDPATDIAV LQIKDPTELK AIALGDSDAL EVGDFVIAVG NPFGLGQTVT 
SGLVSALGRT GLGKQGYEDF IQTDAAINPG NSGGALINLR GELVGINTAI ISPGGGNVGI 
GFAVPINMAR RVMEQLVANG RVDRGRIGVT LLDLDSPADG RVQGARVADV TVGSPAERAG 
LRKGDIIVKA NDMPVRSATQ VRNLIGLTPV GQRVRLVFER DRALGNATVE VAPVTEERAR 
ARSSG