Gene Gobs_3043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_3043
Symbol
ID	8754719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	+
Start bp	3189458
End bp	3190588
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	79%
IMG OID
Product	Uroporphyrinogen III synthase HEM4
Protein accession	YP_003410024
Protein GI	284991470
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.178966
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACCGATG TCCTGCCCGA GGCCCCGCCG GGGACCGAGG CACCGCTGCC CCTGGCCGGG 
TACACCGTCG CGGTGACCGC CGCCCGGCGC CGCGAGGAGC TGGGTGCGCT GCTGGCCCGC 
CGCGGCGCCC GCGTGGTGTA CGCGCCGGCC ATCCGCATCG TGCCGCTGGC CGACGACACC 
GAGCTGGTCG CCGCGACGCG CCAGGTACTG GCGCAGCCGG TGGACCTGGT CGTGGCGACC 
ACCGGCGTCG GCTTCCGCGG GTGGCTGGAG GCGGCCGACG CGTGGGACCT GCCGCTGGTG 
GAGCACCTGC GCGGCGCCCG GGTGCTCGCG CGCGGGCCCA AGGCGCGGGG CGCCATCCGC 
GGCGGCGGGC TGGTCGACGC CTGGTCGCCG GCGTCGGAGT CCTCGGCCGA GGTGCTCGAG 
CACCTGCTCG CCGGGGCCGA GGGCCCGCTG CAGGGACGCC GCATCGCCGT CCAGCTGCAC 
GGCGACCCGC TGCCGGACTT CGTCGAGGCG CTGCGCGCGA CCGGCGCCGA GGTCGTCACC 
GTGCCGGTGT ACCGCTGGGT GCTGCCCGAG GACGTCGAGC CGGTGCGCCG GCTGGTGCGC 
TCGGTGGTCA CCGGCGCGGT CGACGCGGTG ACCTTCACCA GCGCCCCGGC CGCCGCGAGC 
CTGCTGACCG TCGCCGACGA GCTCGGTCAG CGCGCCGAGC TGATCGCCGC GCTGACCGAC 
GGCGTCCTGC CGGTGGCGGT GGGGCCGGTG ACCGCCGGGC CGCTGACCGC CGCGGGCATC 
CCCTCCGTGC AACCGGAACG CGCCCGGCTC GGCGCCCTGG CCCGCGAGGT GGTCGCCCGG 
CTGCCCGAGC GCACCCCGGT GCTGCGGGTG GGCGAGCGGG ACCTGCAGGT GCGCGGGCAC 
GCCGTCCTGC TCGACGGGCG GGTGGTGGAG CTGGCGCCGG GCCCGATGGC GGTGCTGCGC 
TCGCTGGCCG CGCGGCCGGG CACCGTCGTC GCCAAGGCCG ACCTCGTCGC GGGGCTGCCC 
GGCGGCGGCG ACGAGCACGC CGTGGAGATG GCCGTGACCC GGCTGCGCGC CGCGCTCGGC 
CGCGGCGTGG TGGAGACCGT GGTGAAGCGG GGCTACCGCC TGGCTGCGTG A

Protein sequence

MTDVLPEAPP GTEAPLPLAG YTVAVTAARR REELGALLAR RGARVVYAPA IRIVPLADDT 
ELVAATRQVL AQPVDLVVAT TGVGFRGWLE AADAWDLPLV EHLRGARVLA RGPKARGAIR 
GGGLVDAWSP ASESSAEVLE HLLAGAEGPL QGRRIAVQLH GDPLPDFVEA LRATGAEVVT 
VPVYRWVLPE DVEPVRRLVR SVVTGAVDAV TFTSAPAAAS LLTVADELGQ RAELIAALTD 
GVLPVAVGPV TAGPLTAAGI PSVQPERARL GALAREVVAR LPERTPVLRV GERDLQVRGH 
AVLLDGRVVE LAPGPMAVLR SLAARPGTVV AKADLVAGLP GGGDEHAVEM AVTRLRAALG 
RGVVETVVKR GYRLAA