Gene GSU0080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0080
Symbol	degQ
ID	2687866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	91907
End bp	93322
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	63%
IMG OID	637124746
Product	protease degQ
Protein accession	NP_951142
Protein GI	39995191
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCGTCC GTCGTCTGCT ACTGATATCG TTGGTCTTTG TCACAACTCT CACCGCCTGC 
TCGAAGAAGG AAGAAAAGCT CTTCTATGAG TCGGGCCGTG CCGACGCGCC GGTCAAGGAG 
GTTCCCAGAG ACATCCTTGC CACCCAGCAG GCCTTCGTCG AGCTGGTCAA GAAGGTTACT 
CCGTCGGTCG TGAACATCTC CACCGTCAGC CGGAGAAAGA TCGAGCAGCC CTTCTTCGAG 
TTTTCCCCCT TCTTCAATGA TTTCTTCGAC AATCGCCCCC GGTTCCGGCG GGAACAGAGC 
CTCGGCTCTG GCTTCATCAT CAACCGGGAA GGGTACATCG TCACCAATGA CCATGTGGTG 
CGCGACGCCG AAAGCATCAA GGTCAAACTC TCCAATGAGA ACGTCTACGA CGGCCACATC 
GTCGGCAGCG ACCCCAAGAC CGACATCGCG GTCATCAAGA TCGACTCGCG GGAGGAACTC 
CCCGTGGCGG TCCTGGCCGA TTCGGACAAG CTTCAAGTGG GGCAGTGGGC GGTGGCCATC 
GGCAACCCCT TCGGCCTGGA CCGGACCGTG ACCGTCGGCG TGGTGTCGGC CACCGGCCGG 
TCCAACATGG GAATCGAGAC CTATGAAGAT TTCATCCAGA CCGACGCCTC CATCAACCCG 
GGCAATTCGG GGGGGCCGCT GCTGAACGTC CACGGCGAGG TGATCGGCAT CAACACCGCC 
ATCGTGGCCG CCGGTCAGGG GATCGGCTTT GCCATCCCGG TCAACATGGC AAAGCAGATC 
GTAACTCAGC TCATCACCAA GGGCAAGGTC ACCCGCGGCT GGCTCGGCGT TACCATTCAA 
CCGGTCACCG ACGATCTTGC CAAGGAATTC GGCCTGAAAA AGGCCCAGGG CGTCCTGGTG 
AGTGATGTGG TTAAGGGGAG CCCCGCTGCC GGCGCCGGTA TCCGGCAGGG GGACATCATC 
CTCAGGTTCG CCGGCAAGGA GATCAAGGAT GCCCAGCACC TCCAGCGGGT GGTGGGCGAC 
ACGGCGCCGG GGACAAAGGT GCCGGTGGTG GTCTTCCGAG AAGGGAAAGA GGTTCAACTC 
TCCCTGGCGA CGGCCAGTTC CGACAGTGCC CAGGCACGCC AGGCGCGCCC TCAGGGAGGG 
GCGCCCGACA CCCTTGGCCT CGCCGTGGAG GAACTACCCC GCGAATACCG TCAGGAAGGT 
TTCACCGGCG TCCTGGTGGT CCAGGTGGAT GATGGGAGCG CCGCCGGCGA GGCGGGCATC 
CGGGAGGGGG ACGTGATCGT GGCGGTGAAC CGGCGGCCCG TGGCGAACCT GGCAGAGTAC 
GACCGCGTCA TGCGCGAGGC GGCCCGGCGC GGTTCGGTAG TGCTTCTGGT GCGACGAGGC 
GAGGCGAGCA TCTATTTCTC CCTCAGGCTC AGGTAG

Protein sequence

MFVRRLLLIS LVFVTTLTAC SKKEEKLFYE SGRADAPVKE VPRDILATQQ AFVELVKKVT 
PSVVNISTVS RRKIEQPFFE FSPFFNDFFD NRPRFRREQS LGSGFIINRE GYIVTNDHVV 
RDAESIKVKL SNENVYDGHI VGSDPKTDIA VIKIDSREEL PVAVLADSDK LQVGQWAVAI 
GNPFGLDRTV TVGVVSATGR SNMGIETYED FIQTDASINP GNSGGPLLNV HGEVIGINTA 
IVAAGQGIGF AIPVNMAKQI VTQLITKGKV TRGWLGVTIQ PVTDDLAKEF GLKKAQGVLV 
SDVVKGSPAA GAGIRQGDII LRFAGKEIKD AQHLQRVVGD TAPGTKVPVV VFREGKEVQL 
SLATASSDSA QARQARPQGG APDTLGLAVE ELPREYRQEG FTGVLVVQVD DGSAAGEAGI 
REGDVIVAVN RRPVANLAEY DRVMREAARR GSVVLLVRRG EASIYFSLRL R