Gene Gmet_0888 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gmet_0888
Symbol
ID	3738847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter metallireducens GS-15
Kingdom	Bacteria
Replicon accession	NC_007517
Strand	-
Start bp	978332
End bp	979543
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	65%
IMG OID	637778167
Product	peptidase U32
Protein accession	YP_383855
Protein GI	78222108
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.0335605
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0000000000241821
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGATTC CCGAGCTCCT CGCGCCGGCC GGCAACCTGG AAAAGCTGAA GGTGGCCATC 
CACTACGGCG CCGACGCCGT CTACCTGGGA GGGGAGAAGT TCGGGCTCCG CAGCCTCGCC 
GACAACTTCA CCCTGGCCCA CATGGCCGAG GGGATTGCCT ATGCCCACGA CCGGGGGGTA 
AAGGTCTACC TGACGGTCAA CGCCTTTCCC GACAACAGCG AACTGGAGGA CCTGGACCGC 
TACCTGGAGG GGGTTGCTAC AGTCCCCTTC GACGCTTACA TCGCCGCCGA CCCGGGGGTG 
ATCGCCGCCA TCCGCCGCAT ATCGCCAGAT CGTCCCATCC ACCTTTCCAC CCAGGCCAAC 
ACCACCAACT GGCGCAGCGT CCTCTTCTGG CAGAAGCAGG GGATCGCCCG GGTGAACCTG 
GCCCGGGAAA TGTCCCTGGA TGCGATCCGC GAGACCCGGG AGCGGGTCAC GGCCGAACTG 
GAAGTCTTCG TCCACGGCGC CCTCTGCGTC TCCTACTCGG GTCGCTGCCT CCTCTCCAGC 
GTCATGACCG GCCGCAACGC CAACAAGGGG GAGTGCGCCC ACCCCTGCCG CTGGAGCTAC 
GCCCTGGTGG AAGAGACCCG ACCGGGCGAG TACTTCCCCG TGGTGGAGGA CGAGCGGGGG 
ACCTTCATCT TCAACTCCAA GGATCTCTGC CTCATCCGCC ATATCCCTGA ACTGGTGGGG 
GCCGGCGCCG ATTCCCTCAA AATAGAGGGG CGCATGAAGG GAATCCACTA CGTGGCCTCG 
GTGGTGCGAG TCTACCGGGA GGCCCTGGAC AGTTATGCCG CCGATCCTCG CGCCTGGCAC 
ATGCAGTCCG AGTGGCTCGA AGAGCTCTCC AAGATCAGCC ACCGGGGGTA CACCACCGGC 
TTCTTCCTGG GAAAACCAGT GGATGTGGAC CTGGAATTCG ACTCCCGCTA CCGGCGCAGC 
CACGAATTCG TCGGCGTGGT GGAAGAGGCG CACCCCGACG GCACCGTTAC CGTGGAAGTC 
CGCAACCGGA TCGTGGCAGG GACCACGGTG GAGGTCATCG GCCGGCGGAT GCGCTCCACC 
CTCCACCGGC TCGACGCGTT CACCGACATG GATGGCAACA GCCTCTCCGA GGCCCATCCG 
AACCAGCGGA TCCGCGTGAG TCTTCCCGTA GCGGCGGAAC GCTACGACCT TATCCGGCGG 
GAAAAGCCAT AG

Protein sequence

MKIPELLAPA GNLEKLKVAI HYGADAVYLG GEKFGLRSLA DNFTLAHMAE GIAYAHDRGV 
KVYLTVNAFP DNSELEDLDR YLEGVATVPF DAYIAADPGV IAAIRRISPD RPIHLSTQAN 
TTNWRSVLFW QKQGIARVNL AREMSLDAIR ETRERVTAEL EVFVHGALCV SYSGRCLLSS 
VMTGRNANKG ECAHPCRWSY ALVEETRPGE YFPVVEDERG TFIFNSKDLC LIRHIPELVG 
AGADSLKIEG RMKGIHYVAS VVRVYREALD SYAADPRAWH MQSEWLEELS KISHRGYTTG 
FFLGKPVDVD LEFDSRYRRS HEFVGVVEEA HPDGTVTVEV RNRIVAGTTV EVIGRRMRST 
LHRLDAFTDM DGNSLSEAHP NQRIRVSLPV AAERYDLIRR EKP