Gene EcolC_1125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1125
Symbol
ID	6067991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1225898
End bp	1227088
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	53%
IMG OID	641600541
Product	nitric oxide dioxygenase
Protein accession	YP_001724119
Protein GI	170019165
COG category	[C] Energy production and conversion
COG ID	[COG1017] Hemoglobin-like flavoprotein [COG1018] Flavodoxin reductases (ferredoxin-NADPH reductases) family 1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGACG CTCAAACCAT CGCTACAGTA AAAGCCACCA TCCCTTTACT GGTGGAAACG 
GGGCCAAAGT TAACCGCCCA TTTCTACGAC CGTATGTTTA CTCATAACCC AGAACTCAAA 
GAAATTTTTA ACATGAGTAA CCAGCGTAAT GGCGATCAAC GTGAAGCCCT GTTTAACGCT 
ATTGCCGCCT ACGCCAGTAA TATTGAAAAC CTGCCTGCGC TGCTGCCAGC GGTAGAAAAA 
ATCGCGCAGA AGCACACCAG CTTCCAGATC AAACCGGAAC AGTACAACAT CGTCGGTGAA 
CACCTGTTGG CAACGCTGGA CGAAATGTTC AGCCCGGGGC AGGAAGTGCT GGACGCGTGG 
GGTAAAGCCT ATGGTGTACT GGCTAATGTA TTTATCAATC GCGAGGCGGA AATCTATAAC 
GAAAACGCCA GCAAAGCCGG TGGTTGGGAA GGTACTCGCG ATTTCCGCAT TGTGGCTAAA 
ACACCGCGCA GCGCGCTTAT CACCAGCTTC GAACTGGAGC CGGTCGACGG TGGCGCAGTG 
GCAGAATACC GTCCGGGGCA ATATCTCGGC GTCTGGCTGA AGCCGGAAGG TTTCCCGCAT 
CAGGAAATTC GTCAGTACTC TTTGACTCGC AAACCGGATG GCAAAGGCTA TCGTATTGCG 
GTGAAACGCG AAGAGGGTGG GCAGGTATCC AACTGGTTGC ACAATCACGC CAATGTTGGC 
GATGTCGTGA AACTGGTCGC TCCGGCAGGT GATTTCTTTA TGGCTGTCGC AGATGACACA 
CCAGTGACGT TAATCTCTGC CGGTGTTGGT CAAACGCCAA TGCTGGCAAT GCTCGACACG 
CTGGCAAAAG CAGGCCACAC AGCACAAGTG AACTGGTTCC ATGCGGCAGA AAATGGCGAT 
GTTCACGCCT TTGCCGATGA AGTTAAGGAA CTGGGGCAGT CACTGCCGCG CTTTACCGCG 
CACACCTGGT ATCGTCAGCC GAGCGAAGCC GATCGCGCTA AAGGTCAGTT TGATAGCGAA 
GGTCTGATGG ATTTGAGCAA ACTGGAAGGT GCGTTCAGCG ATCCGACAAT GCAGTTCTAT 
CTCTGCGGCC CGGTTGGCTT CATGCAGTTT ACCGCGAAAC AGTTAGTGGA TCTGGGCGTG 
AAGCAGGAAA ACATTCATTA CGAATGCTTT GGCCCGCATA AGGTGCTGTA A

Protein sequence

MLDAQTIATV KATIPLLVET GPKLTAHFYD RMFTHNPELK EIFNMSNQRN GDQREALFNA 
IAAYASNIEN LPALLPAVEK IAQKHTSFQI KPEQYNIVGE HLLATLDEMF SPGQEVLDAW 
GKAYGVLANV FINREAEIYN ENASKAGGWE GTRDFRIVAK TPRSALITSF ELEPVDGGAV 
AEYRPGQYLG VWLKPEGFPH QEIRQYSLTR KPDGKGYRIA VKREEGGQVS NWLHNHANVG 
DVVKLVAPAG DFFMAVADDT PVTLISAGVG QTPMLAMLDT LAKAGHTAQV NWFHAAENGD 
VHAFADEVKE LGQSLPRFTA HTWYRQPSEA DRAKGQFDSE GLMDLSKLEG AFSDPTMQFY 
LCGPVGFMQF TAKQLVDLGV KQENIHYECF GPHKVL