Gene EcolC_4202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4202
Symbol	hemC
ID	6067671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4640754
End bp	4641716
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	56%
IMG OID	641603630
Product	porphobilinogen deaminase
Protein accession	YP_001727126
Protein GI	170022172
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0181] Porphobilinogen deaminase
TIGRFAM ID	[TIGR00212] porphobilinogen deaminase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0530592
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAATGA CGGTAACAAG CATGTTAGAC AATGTTTTAA GAATTGCCAC ACGCCAAAGC 
CCACTTGCAC TCTGGCAGGC ACACTATGTC AAAGACAAGT TGATGGCGAG CCATCCGGGC 
CTGGTCGTTG AACTGGTACC GATGGTGACG CGCGGCGATG TGATTCTTGA TACGCCGCTG 
GCGAAAGTAG GCGGAAAAGG CTTATTTGTA AAAGAGCTGG AAGTCGCGCT CCTCGAAAAT 
CGCGCCGATA TCGCCGTACA TTCAATGAAA GATGTGCCGG TTGAATTCCC GCAAGGTCTG 
GGACTGGTCA CTATTTGTGA GCGTGAAGAT CCTCGCGATG CCTTTGTGTC CAATAACTAT 
GACAGTCTGG ATGCGTTACC GGCAGGCAGT ATCGTCGGGA CGTCCAGTTT ACGTCGCCAG 
TGCCAACTGG CTGAACGCCG TCCGGATCTG ATTATCCGCT CCCTGCGCGG CAACGTCGGC 
ACTCGCCTGA GCAAACTGGA TAACGGCGAA TACGATGCCA TCATTCTTGC CGTAGCCGGA 
CTAAAACGTT TAGGTCTGGA GTCACGTATT CGCGCCGCGT TGCCACCCGA GATTTCTCTT 
CCGGCGGTAG GACAAGGTGC GGTGGGTATT GAATGCCGCC TTGATGATTC ACGCACTCGC 
GAGCTGCTTG CCGCGCTGAA TCACCACGAA ACTGCACTGC GCGTTACCGC AGAACGCGCC 
ATGAATACCC GTCTCGAAGG CGGATGTCAG GTGCCAATTG GTAGCTACGC CGAGCTTATT 
GATGGCGAAA TCTGGCTGCG TGCGCTGGTC GGCGCGCCGG ACGGTTCGCA GATTATTCGC 
GGTGAACGCC GCGGTGCGCC GCAAGATGCC GAACAAATGG GGATTTCGCT GGCAGAAGAG 
CTACTGAATA ACGGCGCGCG CGAGATCCTC GCTGAAGTCT ATAACGGAGA CGCCCCGGCA 
TGA

Protein sequence

MIMTVTSMLD NVLRIATRQS PLALWQAHYV KDKLMASHPG LVVELVPMVT RGDVILDTPL 
AKVGGKGLFV KELEVALLEN RADIAVHSMK DVPVEFPQGL GLVTICERED PRDAFVSNNY 
DSLDALPAGS IVGTSSLRRQ CQLAERRPDL IIRSLRGNVG TRLSKLDNGE YDAIILAVAG 
LKRLGLESRI RAALPPEISL PAVGQGAVGI ECRLDDSRTR ELLAALNHHE TALRVTAERA 
MNTRLEGGCQ VPIGSYAELI DGEIWLRALV GAPDGSQIIR GERRGAPQDA EQMGISLAEE 
LLNNGAREIL AEVYNGDAPA