Gene A9601_02351 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	A9601_02351
Symbol	hemB
ID	4716919
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. AS9601
Kingdom	Bacteria
Replicon accession	NC_008816
Strand	+
Start bp	218928
End bp	219929
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	35%
IMG OID	640077934
Product	delta-aminolevulinic acid dehydratase
Protein accession	YP_001008630
Protein GI	123967772
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0113] Delta-aminolevulinic acid dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATTCGA TTATTCGTCC AAGAAGATTA AGAAGAACTG AGTCAATAAG AGAAATGGTT 
AGAGAAAACC ATTTGGCGGC ATCGGACTTT ATCTATCCAT TATTTATTCA TGAGAAAGAT 
TTTAAAGAGG AAATTTCCGC AATGCCCGGA ACTTATAGAT GGGATATTGA TGGTTTACTA 
AAGGAGGTTA CTAGGGCATG GGAATTGGGA ATTAGATGTG TGGTTCTTTT CCCAAAAATT 
AATGATAGCT TAAAGACTGA AGATGGAGCA GAATGTTTTA ATGAGGACGG TTTAATACCT 
AAAGCTATTC GAATATTAAA AAAAGAGATT CCAGAAATGG CAATAATGAC AGATGTTGCC 
TTGGACCCTT ACTCCTGTGA TGGACATGAT GGCTTAGTTG ATGAAACTGG AAAAATATTG 
AATGATGAAA CGATTGAAAT TTTAAAAAAA CAAGCTTTAA CTCAAGCTAG AGCTGGAGCA 
GATTTTATTG GCCCTAGTGA CATGATGGAT GGGAGAGTTG GAGCAATTAG GACTGCTCTT 
GATAGTGAAG GATTTAGTGA TGTAGGTATT ATTAGTTATA CAGCTAAATA TTCATCTGCT 
TATTATGGTC CGTTTAGAAC TGCTTTAGAT TCGGCTCCTA GAGAAAATAG TAAGAAAGTA 
ATTCCAGACA ATAAGTCTAC ATATCAAATG GACCCTGCCA ATTCAAAAGA GGCTTTAATT 
GAATCTGCAT TGGATCAGTA TGAAGGAGCT GATATTTTGA TGGTAAAACC AGGAATTTCA 
TATTTGGATA TTGTTTATAG AATAAGCACA TTTTCAAATA AGCCCATAGC TGCATACAAC 
GTTAGTGGGG AGTATTCCAT GGTAAAGTCT GCTGCTATGA AGAACTGGAT TAACGAAAAA 
GATATTGTTT TAGAGACATT GCTTAGTTTT AAAAGAGCAG GAGCAAAATT AATACTCACT 
TATCATGCTT GTGATGCATC TCAATGGTTG CAGGATACTT AA

Protein sequence

MNSIIRPRRL RRTESIREMV RENHLAASDF IYPLFIHEKD FKEEISAMPG TYRWDIDGLL 
KEVTRAWELG IRCVVLFPKI NDSLKTEDGA ECFNEDGLIP KAIRILKKEI PEMAIMTDVA 
LDPYSCDGHD GLVDETGKIL NDETIEILKK QALTQARAGA DFIGPSDMMD GRVGAIRTAL 
DSEGFSDVGI ISYTAKYSSA YYGPFRTALD SAPRENSKKV IPDNKSTYQM DPANSKEALI 
ESALDQYEGA DILMVKPGIS YLDIVYRIST FSNKPIAAYN VSGEYSMVKS AAMKNWINEK 
DIVLETLLSF KRAGAKLILT YHACDASQWL QDT