Gene HS_1540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	HS_1540
Symbol	hemE
ID	4241061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haemophilus somnus 129PT
Kingdom	Bacteria
Replicon accession	NC_008309
Strand	-
Start bp	1737121
End bp	1738185
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	42%
IMG OID	638105120
Product	uroporphyrinogen decarboxylase
Protein accession	YP_719745
Protein GI	113461676
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0588582
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGTCT TGAAAAATGA GCGTTACTTA AAAGCATTAT TGCGTGAACC TGTGGATATG 
ACGCCCGTTT GGATGATGCG TCAAGCCGGA CGTTATTTAC CGGAATATAA AGCAACTCGT 
GCAAAAGCAG GGGATTTTAT GTCCCTTTGC CGTAATGCCG ATTTAGCGTG TGAAGTGACT 
TTGCAACCTT TACGTCGCTA TGATCTGGAT GCTGCTATTT TATTTTCGGA TATTCTGACT 
ATCCCTGATG CCATGGGGTT GGGATTGAGT TTTGGTGTGG GCGAAGGTCC TAAATTTGCA 
CGACCAGTTG AGAACAAAAG TGCGGTACAA AATCTTCCGA TTCCCGACCC TGAACAAGAG 
TTACAGTATG TGATGAATGC GGTGCGTACT ATTCGTCGTG AGTTAAAAGG TGAAGTTCCT 
CTTATCGGTT TTTCCGGAAG TCCTTGGACT TTAGCAACCT ACATGGTTGA AGGCGGAAGC 
AGTAAAGCCT TTACTAAAAT CAAAAAAATG ATGTATTCCG AGCCAAAAAT ATTGCATCTG 
TTATTGGATA AGTTAGCAGA CGCCGTGATA CTTTATCTTA ATGCACAAAT TAACGCTGGC 
GTGCAGGCGG TGATGGTTTT CGATACGTGG GGCGGTGTAT TGGGACATCG TGAATATTTG 
GATTTCTCAT TGCAATATAT GCACAAAATT GTTGATGGCT TAATTCGTGA AAATGACGGA 
TATAAAGTGC CAGTTACTTT GTTTACGAAA GGTGGTGGTT TGTGGTTAGA GGCAATGGCA 
AGTACGGGGT GTGATGCACT AGGTTTAGAT TGGACGGTAA ATTTAGCAGA GGCAAAAGCA 
CGAGTTGGGC ATAAAGTTGC GTTACAAGGA AATATGGATC CTTCCGTATT ATATGCTTCG 
CCTGCACGAA TTGAGCAGGA AGTACAACAA ATTCTTGCCG ATTTTGGACA AGGTAGCGGA 
CATGTGTTTA ACTTAGGACA TGGTATTCAT CAAGATGTTC CGGAAATTAG TCCGAAGGTT 
TTTGTGGATG CTGTTCATCA ATATTCAGTA TCCTATCATC AATAA

Protein sequence

MTVLKNERYL KALLREPVDM TPVWMMRQAG RYLPEYKATR AKAGDFMSLC RNADLACEVT 
LQPLRRYDLD AAILFSDILT IPDAMGLGLS FGVGEGPKFA RPVENKSAVQ NLPIPDPEQE 
LQYVMNAVRT IRRELKGEVP LIGFSGSPWT LATYMVEGGS SKAFTKIKKM MYSEPKILHL 
LLDKLADAVI LYLNAQINAG VQAVMVFDTW GGVLGHREYL DFSLQYMHKI VDGLIRENDG 
YKVPVTLFTK GGGLWLEAMA STGCDALGLD WTVNLAEAKA RVGHKVALQG NMDPSVLYAS 
PARIEQEVQQ ILADFGQGSG HVFNLGHGIH QDVPEISPKV FVDAVHQYSV SYHQ