Gene SeHA_C4268 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4268
Symbol	hemC
ID	6490768
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4154979
End bp	4155935
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	59%
IMG OID	642744360
Product	porphobilinogen deaminase
Protein accession	YP_002047954
Protein GI	194449507
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0181] Porphobilinogen deaminase
TIGRFAM ID	[TIGR00212] porphobilinogen deaminase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	90
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGTAA CAAGCATGTT AGACAATGTT TTAAGAATTG CCACACGCCA AAGTCCCCTT 
GCGCTTTGGC AGGCACATTA TGTCAAAGAC GCATTGATGG CAACCCATCC GGGACTGACG 
GTAGAACTGG TGCCGATGGT CACACGCGGC GACGTGATTC TCGATACTCC CCTGGCGAAA 
GTGGGCGGTA AGGGACTGTT TGTTAAAGAG CTTGAAATCG CGCTGCTGGA AAAACGCGCT 
GATATCGCCG TGCACTCTAT GAAAGACGTT CCGGTGGCCT TCCCGGACGG TCTCGGTCTG 
GTGACCATTT GCGAGCGCGA AGATCCGCGC GACGCGTTTG TCTCGAATAA ATATCACAGT 
CTGGACGATC TGCCCGCGGG TAGTATCGTC GGGACGTCCA GTTTGCGTCG CCAGTGTCAA 
CTGGCGGAAC GCCGTCCGGA CCTCATTATC CGTTCGTTGC GCGGCAACGT CGGCACACGT 
CTCGGCAAGC TGGACAACGG CGACTATGAC GCCATTATCC TGGCCGTGGC CGGTCTGAAA 
CGCTTAGGTC TGGAGTCGCG CATTCGCACA GCCTTGCCGC CCGACGTTTC GCTTCCTGCC 
GTAGGCCAGG GCGCCGTCGG GATTGAGTGT CGTCTTGACG ACGCGCGAAC ACAGGCGCTG 
CTCGCACCGT TGAATCACTC GCAAACCGCG CTACGCGTAA CGGCGGAACG CGCTATGAAC 
ACCCGCCTGG AAGGCGGATG TCAGGTGCCG ATTGGCAGCT ATGCAGAAAT CATCAACGGT 
GAAATTTGGC TACGCGCGCT GGTTGGCGCG CCGGACGGTT CGGTGATGGT GCGCGGCGAA 
CGTCGTGGTT CTCCCGAGCA GGCGGAGCAA ATGGGCATCT CGCTTGCAGA GGAACTGCTG 
GAAAACGGCG CACGCGCGAT TCTGACGGAA GTTTATAACG GCGAGACGCC CGCATGA

Protein sequence

MTVTSMLDNV LRIATRQSPL ALWQAHYVKD ALMATHPGLT VELVPMVTRG DVILDTPLAK 
VGGKGLFVKE LEIALLEKRA DIAVHSMKDV PVAFPDGLGL VTICEREDPR DAFVSNKYHS 
LDDLPAGSIV GTSSLRRQCQ LAERRPDLII RSLRGNVGTR LGKLDNGDYD AIILAVAGLK 
RLGLESRIRT ALPPDVSLPA VGQGAVGIEC RLDDARTQAL LAPLNHSQTA LRVTAERAMN 
TRLEGGCQVP IGSYAEIING EIWLRALVGA PDGSVMVRGE RRGSPEQAEQ MGISLAEELL 
ENGARAILTE VYNGETPA