Gene ECD_02444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_02444
Symbol	hmpA
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	+
Start bp	2551640
End bp	2552830
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	52%
IMG OID
Product	fused nitric oxide dioxygenase/dihydropteridine reductase 2
Protein accession	ACT44264
Protein GI	253978594
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTGACG CTCAAACCAT CGCTACAGTA AAAGCCACCA TCCCTTTACT GGTGGAAACG 
GGGCCAAAGT TAACCGCCCA TTTCTACGAC CGTATGTTTA CTCATAACCC AGAACTCAAA 
GAAATTTTTA ACATGAGTAA CCAGCGTAAT GGCGATCAAC GTGAAGCCCT GTTTAACGCT 
ATTGCCGCCT ACGCCAGTAA TATTGAAAAC CTGCCTGCGC TGCTGCCAGC GGTAGAAAAA 
ATCGCGCAGA AGCACACCAG TTTCCAGATC AAACCGGAAC AGTACAACAT CGTCGGTGAA 
CACCTGTTGG CAACGCTGGA CGAAATGTTC AGCCCGGGGC AGGAAGTGCT GGACGCGTGG 
GGTAAAGCCT ATGGTGTACT GGCTAATGTA TTTATCAATC GCGAGGCGGA AATCTATAAC 
GAAAACGCCA GCAAAGCCGG TGGTTGGGAA GGTACTCGCG ATTTCCGCAT TGTGGCTAAA 
ACACCGCGCA GCGCGCTTAT CACCAGCTTC GAACTGGAGC CGGTCGACGG TGGCGCAGTG 
GCAGAATACC GTCCGGGGCA ATATCTCGGC GTCTGGCTGA AGCCGGAAGG TTTCCCGCAT 
CAGGAAATTC GTCAGTACTC TTTGACTCGC AAACCGGATG GCAAAGGCTA TCGTATTGCG 
GTGAAACGCG AAGAGGGTGG GCAGGTATCC AACTGGTTGC ACAATCACGC CAATGTTGGC 
GATGTCGTGA AACTGGTCGC TCCGGCAGGT GATTTCTTTA TGGCTGTCGC AGATGACACA 
CCAGTGACGT TAATCTCTGC CGGTGTTGGT CAAACGCCAA TGCTGGCAAT GCTCGACACG 
CTGGCAAAAG CAGGCCACAC AGCACAAGTG AACTGGTTCC ATGCGGCAGA AAATGGCGAT 
GTTCACGCCT TTGCCGATGA AGTTAAGGAA CTGGGGCAGT CACTGCCGCG CTTTACCGCG 
CACACCTGGT ATCGTCAGCC GAGCGAAGCC GATCGCGCTA AAGGTCAGTT TGATAGCGAA 
GGTCTGATGG ATTTGAGCAA ACTGGAAGGT GCGTTCAGCG ATCCGACAAT GCAGTTCTAT 
CTCTGCGGCC CGGTTGGCTT CATGCAGTTT ACCGCGAAAC AGTTAGTAGA TCTGGGCGTG 
AAGCAGGAAA ACATTCATTA CGAATGCTTT GGCCCGCATA AGGTGCTGTA A

Protein sequence

MLDAQTIATV KATIPLLVET GPKLTAHFYD RMFTHNPELK EIFNMSNQRN GDQREALFNA 
IAAYASNIEN LPALLPAVEK IAQKHTSFQI KPEQYNIVGE HLLATLDEMF SPGQEVLDAW 
GKAYGVLANV FINREAEIYN ENASKAGGWE GTRDFRIVAK TPRSALITSF ELEPVDGGAV 
AEYRPGQYLG VWLKPEGFPH QEIRQYSLTR KPDGKGYRIA VKREEGGQVS NWLHNHANVG 
DVVKLVAPAG DFFMAVADDT PVTLISAGVG QTPMLAMLDT LAKAGHTAQV NWFHAAENGD 
VHAFADEVKE LGQSLPRFTA HTWYRQPSEA DRAKGQFDSE GLMDLSKLEG AFSDPTMQFY 
LCGPVGFMQF TAKQLVDLGV KQENIHYECF GPHKVL