Gene GSU2556 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU2556
Symbol
ID	2685493
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	+
Start bp	2818455
End bp	2819669
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	67%
IMG OID	637127246
Product	U32 family peptidase
Protein accession	NP_953602
Protein GI	39997651
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGATCC CCGAACTCCT GGCCCCGGCC GGGAACCTCG AAAAACTCAA AGTGGCCGTC 
CACTACGGCG CCGACGCCGT CTACCTGGGC GGTGCCCGCT TCGGACTGCG GAGCCAGGCC 
GACAATTTCA CCCCCGCCAC CATGGCCGAG GCCGTGGCCT ATGCCCACGA CCGGGGGGTG 
AAGGTCTACC TCACGGTCAA CAGCTATCCC GACACCGACG AGCTGGAGGA ACTGGACCGC 
TACCTGGAAG AGGTAGCGCC GATCCCCTTC GACGCCTTCA TCGCCGCCGA TCCCGGGGTC 
ATCGCCACCA TCCGCCGCAT CGTCCCGGAC CGCACCATCC ATCTCTCGAC CCAGGCCAAT 
ACCACCACCT GGCGCAGCGC CCTCTTCTGG CAGCAGCAGG GCATCAGCCG CATCAACCTG 
GCCCGGGAGA TGTCCCTGGA GGCGATCCGC GAAACCCGCC GCCGCGTGTC GGCCGAACTG 
GAGGTCTTTG CCCACGGCGC TCTCTGCGTG GCCTATTCGG GGCGCTGCCT CCTCTCCGCC 
GTCATGACCG GGCGCCATGC CAACCGGGGG GAGTGCACCC ATCCCTGCCG CTGGAGCTAC 
GCCCTGGTGG AGGAAAGCCG GCCCGGCGAG TACTACCCGG TCACTGAGGA CGAAAACGGC 
ACGTTCATCT TCAACTCCCG GGACCTCTGC CTCATCCGCC ACATTCCCGA GCTGGTGGAG 
GCGGGAGTCG ACTCCCTCAA GATCGAGGGG AGAATGAAGG GAATCCACTA CGTGGCGTCG 
GTGGTGCGGG TCTACCGGGA GGCGCTCGAC CGCTATGCCG CCGACCCCGC CGGCTACGCG 
TTCCGTCCCG AGTGGCTGGA GGAACTGTCC AAGGTGAGCC ACCGGGGATA CACCACCGGC 
TTCCTCCTGG GCCGCCCCGA GGCGGCGGAC CTGGAGTACG ACTCCCGTTA TCTGCGCAGC 
CATGACTTTC TCGCCGTGGT GGACGAGATC CTACCCGACG GCACCGCCAT CCTTGCCGTC 
CGCAACCGCA TCCGGCCAGG CTGGACCATG GAGCTGATGG GGCCGGGCAT GCGCTCGGAT 
ACCTTCAGGC TCGACACCTT CACCGACGAG AACGGGGCTC CCCTGACCGA AGCCCACCCG 
AACCAACGGA TCCGGACGAT ACTCCCCGAA GCGGCCGCCC CCTGGGATCT GCTACGGCGG 
GAACGGGACG ACTGA

Protein sequence

MQIPELLAPA GNLEKLKVAV HYGADAVYLG GARFGLRSQA DNFTPATMAE AVAYAHDRGV 
KVYLTVNSYP DTDELEELDR YLEEVAPIPF DAFIAADPGV IATIRRIVPD RTIHLSTQAN 
TTTWRSALFW QQQGISRINL AREMSLEAIR ETRRRVSAEL EVFAHGALCV AYSGRCLLSA 
VMTGRHANRG ECTHPCRWSY ALVEESRPGE YYPVTEDENG TFIFNSRDLC LIRHIPELVE 
AGVDSLKIEG RMKGIHYVAS VVRVYREALD RYAADPAGYA FRPEWLEELS KVSHRGYTTG 
FLLGRPEAAD LEYDSRYLRS HDFLAVVDEI LPDGTAILAV RNRIRPGWTM ELMGPGMRSD 
TFRLDTFTDE NGAPLTEAHP NQRIRTILPE AAAPWDLLRR ERDD