Gene Gmet_1014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_1014
Symbol
ID	3740357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	+
Start bp	1126874
End bp	1128304
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	58%
IMG OID	637778293
Product	peptidase S1C, Do
Protein accession	YP_383981
Protein GI	78222234
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	62
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCATT GGACGCTGAA ATCTGCTGGC AAAATATCCC TTCTGACAGC TTTTCTCCTG 
ATTTCGCTAA TTTTCCTGGG GGGATGCGAC GGGAGGAGCA AGACCGAATT CGTGGGATTC 
CCCCAATCAT TCGCCGATCT CGCCGAAAAA ATCAGACCCG CCGTGGTGAA CATCAGCACC 
ACATCAACCG TCAAAGTACC CGGCAATCCC TTCAGGCACT TTTTCGGCCC CGAGGAAGAA 
GGGCCGTTTG GTGATTTCTT CAAGCATTTT TTCGGCGACA TGCCCGACCG TGAGCTGAAA 
CAGCAGAGTC TCGGCTCCGG GATCATCACC GACAAGGACG GGTACATCGT CACCAACAAC 
CACGTGGTGG ATAATGCCGA GGAGATAAAG GTCAAGATCT CTGACGGCAG AGAATTCAAG 
GCCAAGGTTA TCGGAAGGGA TCCCAAAACC GATCTTGCGC TGATCAAGAT ATCTTCCCCC 
TTCAGAAATC TCCCCGTCCT CCCCCTCGGC GACTCCGACA AAATGAGAGT TGGTGATTGG 
GTGCTTGCAG TGGGGAACCC GTTCGGTCTC GAACACACCG TGACCCAGGG GATCATCAGC 
GCCACCGGGA GGGTGATCGG TTCCGGGCCC TATGACAATT TCCTCCAGAC CGACGCCCCC 
ATCAACCCTG GCAACAGCGG CGGCCCCCTG GTCAACCTCA AAGGGGAGGT GATCGGGATC 
AATACCGCCA TCGTCCCCGG CGGGCAGGGG CTCGGCTTTG CCATCCCGAG CAGCATGGCC 
AAAATGGTGC TCAAGCAGTT GCAGGAGAAG GGGAAAGTGG TGCGGGGATG GCTCGGTGTT 
ACGATCCAGA CCGTAACCCC CGACCTGGCC GCCTCCTTTG GCCTCAAGGA GGCGAAGGGG 
GCCCTCGTCT CCGACATCGC GGAAGGAGGA CCGGCCGCCA AAGGGGGAAT CAGGCGGGGA 
GATATCATCC TTTCCTTTGA CGGGAAAAAT GTGAAGGACT CCATGGAACT GCCCCGAATC 
GTAGCGGAAA CCCCGGTCGG CAAAGAGGTG GATGTCACGG TGCTCAGGGA AGGGAAAGAG 
GTGCATTGCA GGGTGAGGGT CGAGGAACTC ACGGAACAGA GGATTGCCGC CCAGACCGAG 
GCGCCGACGG ACAGCTTCGG AATGACGTTT GTCGACATTA CCCCCAAGGT GCGGCAACAA 
CTCGGGATCA AAGAGAAAAC GGGAGTTGTC GTTGCCGGAG TGGAGCCCGG GAGCATCGCC 
GAAGATGCGG GTATCCGGGC GGGGGATGTG ATCAAGGAAG TTAATCGCAA ACCGGTCAGA 
AACCTGGCGG ACTTGAGCAG TGCCTTGGAG AAGTCCGCAA AGGGGCAACC GGTCCTCTTG 
CTGCTCAATC GGGGAAGTCA GACTTTCTAT GTGACGCTGG AAACTTCGTA G

Protein sequence

MKHWTLKSAG KISLLTAFLL ISLIFLGGCD GRSKTEFVGF PQSFADLAEK IRPAVVNIST 
TSTVKVPGNP FRHFFGPEEE GPFGDFFKHF FGDMPDRELK QQSLGSGIIT DKDGYIVTNN 
HVVDNAEEIK VKISDGREFK AKVIGRDPKT DLALIKISSP FRNLPVLPLG DSDKMRVGDW 
VLAVGNPFGL EHTVTQGIIS ATGRVIGSGP YDNFLQTDAP INPGNSGGPL VNLKGEVIGI 
NTAIVPGGQG LGFAIPSSMA KMVLKQLQEK GKVVRGWLGV TIQTVTPDLA ASFGLKEAKG 
ALVSDIAEGG PAAKGGIRRG DIILSFDGKN VKDSMELPRI VAETPVGKEV DVTVLREGKE 
VHCRVRVEEL TEQRIAAQTE APTDSFGMTF VDITPKVRQQ LGIKEKTGVV VAGVEPGSIA 
EDAGIRAGDV IKEVNRKPVR NLADLSSALE KSAKGQPVLL LLNRGSQTFY VTLETS