Gene Ava_1574 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_1574
Symbol	hemH
ID	3681117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	1944974
End bp	1946140
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	46%
IMG OID	637716914
Product	ferrochelatase
Protein accession	YP_322092
Protein GI	75907796
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0276] Protoheme ferro-lyase (ferrochelatase)
TIGRFAM ID	[TIGR00109] ferrochelatase

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.634764
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCGTG TAGGCGTATT ATTACTCAAT CTCGGTGGTC CCGATAAGCT GGAGGATGTA 
GGGCCTTTTT TGTTTAACCT ATTCTCCGAT CCGGAAATTA TACGCTTACC ATTCCGGTGG 
TTGCAGAAGC CCTTGGCTTG GTTTATTGCT TCTCGACGCA CCAAAACCTC CCAAGAGAAC 
TATAAGCAAA TTGGCGGTGG CTCCCCACTA CGGCGGATTA CGGAAGCCCA AGGAGAAGCC 
TTAAAGGAAC AGTTGCATGA TTTGGGTCAA GAAGCGAATA TCTATGTGGG AATGCGTTAT 
TGGCATCCAT ATACGGAAGA AGCGATCGCT CTTTTGACCC AAGATAACCT GGATAACTTG 
GTGATTTTGC CACTATACCC CCAATTCTCC ATCAGCACTA GTGGCTCTAG CTTCCGTCTA 
CTAGAAAGAC TTTGGCAAGA AGACCCCAAA CTACAACGTC TGGACTACAC CGTCATCCCC 
TCTTGGTATA AAGAACCATG TTATTTACAG GCGATGGCGG AACTCATTAG CCAAGAAGTA 
GACCAATTTC CTGATCCTGA TCAAGTTCAT GTGTTCTTCA GCGCTCATGG TGTACCCAAA 
AGCTATGTTG AAGAAGCAGG CGACCCCTAT CAGCAGGAGA TTGAGGAATG TACTGCATTA 
ATTATGCAAA CCCTCAATCG ACCAAATCCT CACACTTTAG CCTATCAAAG TCGCGTCGGC 
CCAGTTGAAT GGCTGCAACC CTATACCGAA GATGCGCTCA AAGAACTAGG CGCGCAAGGT 
GTCAAAGATT TAGTTGTCGT ACCTATCAGT TTCGTCTCCG AACACATCGA GACACTACAA 
GAAATTGATA TCGAGTATCG GGAAATAGCA GAAGAAGCCG GAATCCACAA TTTCCGTCGT 
GTCGCTGCAC CTAATACCCA TCCGGTATTT ATTAGAGCTT TGGCGAATTT AGTAATTGAC 
GCGCTCAACA AACCCAGCTT CAAGCTGTCG CAAGCAGCCC AAATCAAGAA AATGGTGAAA 
ATGTATCCTC CTGAGAGTTG GGAATGGGGT ATGACTTCTA GTGCGGAAGT TTGGAATGGA 
CGGATTGCGA TGTTAGGTTT TATTGCTCTC ATCATCGAGT TAGTGACAGG TCAAGGCCTA 
CTGCATATGA TTGGGCTTTT GCAGTAG

Protein sequence

MGRVGVLLLN LGGPDKLEDV GPFLFNLFSD PEIIRLPFRW LQKPLAWFIA SRRTKTSQEN 
YKQIGGGSPL RRITEAQGEA LKEQLHDLGQ EANIYVGMRY WHPYTEEAIA LLTQDNLDNL 
VILPLYPQFS ISTSGSSFRL LERLWQEDPK LQRLDYTVIP SWYKEPCYLQ AMAELISQEV 
DQFPDPDQVH VFFSAHGVPK SYVEEAGDPY QQEIEECTAL IMQTLNRPNP HTLAYQSRVG 
PVEWLQPYTE DALKELGAQG VKDLVVVPIS FVSEHIETLQ EIDIEYREIA EEAGIHNFRR 
VAAPNTHPVF IRALANLVID ALNKPSFKLS QAAQIKKMVK MYPPESWEWG MTSSAEVWNG 
RIAMLGFIAL IIELVTGQGL LHMIGLLQ