Gene Rsph17029_2334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2334
Symbol	hemC
ID	4896430
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2470072
End bp	2471040
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	69%
IMG OID	640112930
Product	porphobilinogen deaminase
Protein accession	YP_001044208
Protein GI	126463094
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0181] Porphobilinogen deaminase
TIGRFAM ID	[TIGR00212] porphobilinogen deaminase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.69155
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.249742
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACAGCG CTAACCAAAT CGGCATGACA CACTCCATGC CCACCCCCGC TGAACCCCTC 
AAGATCGGCA CGCGCGGCTC GCCGCTTGCG CTGGCTCAGG CCTACGAGAC CCGCAGCCGC 
CTGTCGGCCG CCTTCTCGCT GCCGGAAGAG GCATTCGAAA TCGTGGTCAT AAAAACCACA 
GGTGACAAGG TCTTGGACCG TCCGCTCAAG GAGATCGGCG GCAAGGGCCT GTTCACCCGC 
GAGATCGAGG AGGCCCTGCT GTCGGGGGGA ATCGACATCG CGGTCCATTC GATGAAGGAC 
ATGCCGACGC TTCAGCCCGA GGGGCTGATC CTCGACACCT ACCTCCCGCG CGAGGACACG 
CGGGATGCCT TCATCACCTT CGCCGAGGGG GGGCTGGCGG ATTTGCCGCA GGGGGCCACG 
GTCGGCTCGT CGAGCCTGCG CCGCCGCGCG CAGCTGCTGA ACAAGCGGCC GGACCTGCAG 
GTGGTCGAGT TCCGCGGGAA CCTCCAGACC CGTCTGAAGA AGCTGAACGA CGGGGTGGCG 
CGGGGCACCT TCCTCGCGAT GGCCGGGCTG AACCGGCTGA AGATGAACGA GGTGCCGCGG 
GTGCCGATCG AGCCCGAGGA AATGCTCTCG GCCGTGGCGC AGGGCGCCAT CGGGATCGAG 
CGACGGACCG ACGATCCGCG GGCGCAGGAG ATGCTGGCGG CGATCCATGA CGTGCCCACG 
GGGCACCGGC TCGCGGCCGA GCGCAGCTTC CTTCTGAAGC TCGACGGCTC GTGCGAGACG 
CCGATCGCGG GGCTCGCGAT CCTCGAGGGC GATCAGCTGT GGCTGCGCGG CGAGATCCTG 
CGGCCGGACG GGTCCGAGTC GATCTCGGGC GAGATCCGCG GTGCGATCGC GGATGCGGCC 
GCCCTCGGGG TCGAACTGGC CTCGGAGCTT CTGGGCCGGG CGCCGGCCGA CTTCTTCAGC 
TGGCGTTGA

Protein sequence

MDSANQIGMT HSMPTPAEPL KIGTRGSPLA LAQAYETRSR LSAAFSLPEE AFEIVVIKTT 
GDKVLDRPLK EIGGKGLFTR EIEEALLSGG IDIAVHSMKD MPTLQPEGLI LDTYLPREDT 
RDAFITFAEG GLADLPQGAT VGSSSLRRRA QLLNKRPDLQ VVEFRGNLQT RLKKLNDGVA 
RGTFLAMAGL NRLKMNEVPR VPIEPEEMLS AVAQGAIGIE RRTDDPRAQE MLAAIHDVPT 
GHRLAAERSF LLKLDGSCET PIAGLAILEG DQLWLRGEIL RPDGSESISG EIRGAIADAA 
ALGVELASEL LGRAPADFFS WR