Gene GSU0012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GSU0012
Symbol	hemG
ID	2685243
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sulfurreducens PCA
Kingdom	Bacteria
Replicon accession	NC_002939
Strand	-
Start bp	20296
End bp	21705
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	65%
IMG OID	637124674
Product	protoporphyrinogen oxidase
Protein accession	NP_951074
Protein GI	39995123
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1232] Protoporphyrinogen oxidase
TIGRFAM ID	[TIGR00562] protoporphyrinogen oxidase

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGG CGATTGTGGC CGGCGGCGGC ATCTCAGGGC TCGCCACCGC GTACCTGCTG 
AAAACCCGGG CCGCGGAGGA AGGACTTGAG CTCGACGTGA CCCTGGTGGA GCGGGAGGAA 
CGCCTGGGGG GCAAAATCTG GAGCATCAAG GAGGAGGGGT ATCTCTGCGA GTGGGGCCCC 
AACGGTTTTC TGGACTCCAA ACCCCAGACC CTCGACCTCT GCCGGGAACT GGGCGCGTCT 
GACCTGCTCC TGCGGAGCAA CGACAACGCC CGCAAGCGGT TCATCTACAC CGGCGGGGCG 
CTGAACCGCC TACCCGAGAA CGGACCCATG TTTCTCAAAA GCGGTCTCAT CTCCTGGCCG 
GGCAAGCTGC GGCTCGCCAT GGAACCGTTC ATTCCGAAAA AAGCGGGCGA CGAGGACGAA 
ACCCTGGCGG CCTTCGGCCG GCGCCGCCTG GGGGACGAAG CGCTGCGCAA GCTGATTGCG 
CCCATGGTGT CGGGGATTTT TGCCGGCAAT CCGGAAACCA TGTCCCTGCG GTCGTGCTTT 
CCCCGCATCG CCGAGTTGGA GGATGAATAC GGCAGCTTGG TGCGGGCCAT GATCCGTCTG 
GCGAAAAAGA AGAAGCAGGA GGTCGCTCAA GGAAAGGCGG TGGCCAGCGC CGCCGGACCG 
GGCGGGGTGC TCACCTCGTT CCGGGACGGC ATCCAGGCCC TCACCGATAT CCTGGCCGAG 
CGTCTCGGTC CGGACACTAT CGTATCGGGC CAGGAAGTGC TGGAAGTTTC GCGGGGCGGA 
AGCCTCCCCT GGCGGGTGCG GACCGGAAGC ATCGATATGG ACGCCGATCT GGTGATCCTG 
GCGACCCCCG CCTATGCCAC CGCCTCCATC ATTCAGGGAG TGGACTCCGA CATGGCCGGC 
ATTCTCCGGC AGATCCCCTA CGCCACCATG ACCGTTGTCT GCTTCGGATA TGACCGGGAG 
CGGATCGCCC ACGATCTGAA CGGCTTCGGC TATCTCATTC CAAAGGAGGA GGGGATGAAT 
ACCCTGGGCA CGCTCTGGGA TTCGAGCATC TTCGAGAACC GGGCGCCGGA AGGTCAGGTC 
CTCCTGCGCA GCATGATGGG GGGGGCCTGC TTCCCCGAAT ACGTCAACCT GACCGACGAG 
GAGGTCACTG GGCGGGTGAA GAACGACCTC GCCACCATCA TGGGCATCAC GGCGCCTCCT 
TCGTTCGTCC GCATCTTCCG CCATCACCAG GCCATCCCCC AGTACACCGT GGGGCACTCC 
ACACGCGTAG CCGCTCTGGA GCAGAGAGCC GCCTCCCTGC CGGGACTTTT CCTCACCGGC 
AACTCTTACC GGGGTATCGG CCTCAACGAC TGCGTGGCCG CCGCCAACCG CACCGCCGGC 
GAGGCCATCG CCCAGCTCAC ATCCCGCTGA

Protein sequence

MKKAIVAGGG ISGLATAYLL KTRAAEEGLE LDVTLVEREE RLGGKIWSIK EEGYLCEWGP 
NGFLDSKPQT LDLCRELGAS DLLLRSNDNA RKRFIYTGGA LNRLPENGPM FLKSGLISWP 
GKLRLAMEPF IPKKAGDEDE TLAAFGRRRL GDEALRKLIA PMVSGIFAGN PETMSLRSCF 
PRIAELEDEY GSLVRAMIRL AKKKKQEVAQ GKAVASAAGP GGVLTSFRDG IQALTDILAE 
RLGPDTIVSG QEVLEVSRGG SLPWRVRTGS IDMDADLVIL ATPAYATASI IQGVDSDMAG 
ILRQIPYATM TVVCFGYDRE RIAHDLNGFG YLIPKEEGMN TLGTLWDSSI FENRAPEGQV 
LLRSMMGGAC FPEYVNLTDE EVTGRVKNDL ATIMGITAPP SFVRIFRHHQ AIPQYTVGHS 
TRVAALEQRA ASLPGLFLTG NSYRGIGLND CVAAANRTAG EAIAQLTSR