Gene EcSMS35_2834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2834
Symbol	norW
ID	6143799
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	2909139
End bp	2910272
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	54%
IMG OID	641617703
Product	nitric oxide reductase
Protein accession	YP_001744858
Protein GI	170681646
COG category	[C] Energy production and conversion
COG ID	[COG1251] NAD(P)H-nitrite reductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.0243221
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACA GCATTGTGAT CATTGGTTCG GGCTTCGCCG CCCGCCAACT GGTGAAAAAT 
ATTCGCAAAC AGGACGCCAG TATTCCATTA ACTCTGATTG CCGCCGACAG CATGGATGAG 
TACAACAAAC CTGACCTCAG CCATGTTATC AGTCAGGGGC AACGTGCCGA CGACCTTACC 
CGCCAGACGG CAGGTGAATT TGCCGAGCAG TTTAATCTGC GCCTGTTTCC GCACACCTGG 
GTAACGGATA TCGATGCCGA AGCCCATGTG GTGAAAAGTC AGAATAATCA GTGGCAATAC 
GACAAGTTAG TGCTGGCAAC CGGTGCCAGC GCCTTTGTCC CGCCAGTGCC CGGGCGTGAG 
TTAATGCTGA CGTTAAATAG TCAGCAAGAG TATCGCGCCT GTGAAACGCA ACTGCGGGAT 
GCCCGACGCG TGTTGATTGT TGGCGGTGGC TTGATTGGTA GCGAGCTGGC GATGGATTTT 
TGTCGGGCAG GCAAAGCGGT CACGCTGATC GACAACGCTG CCAGTATTCT GGCGTCGTTA 
ATGCCACCGG AAGTAAGCAG CCGCTTGCAG CATCGGTTGA CGGAGATGGG CGTTCATCTG 
CTGTTAAAAT CTCAGTTGCA GGGACTGGAA AAAACGGATT CTGGCATTCT GGCAACGCTG 
GAATGCCAGC GCTGCATTGA AGTGGATGCG GTAATTGCCG CCACCGGACT GCGCCCGGAA 
ACCGCCCTGG CACGACGCGC CGGGCTGACG ATTAATCGTG GCGTTTGCGT CGATAGTTAT 
CTGCAAACCA GTAATGCCGA TATTTATGCG CTGGGCGATT GCGCGGAAAT TAACGGTCAG 
GTATTGCCGT TCCTCCAGCC GATTCAACTT AGCGCAATGG TGCTGGCAAA AAATCTTCTC 
GGCAATAACA CGCCGCTGAA ACTCCCGGCG ATGCTGGTGA AAATCAAAAC GCCAGAATTA 
CCGCTGCATC TGGCAGGCGA AACCCAGCGT CAGGATTTAC GCTGGCAAAT TAATACCGAA 
CGCCAGGGAA TGGTTGCGCG CGGTGTTGAC GATGCTGACC AGCTTCGCGC CTTTGTGGTC 
AGTGAGGATC GGATGAAAGA GGCGTTTGGA TTGTTGAAAA CGTTGCCGAT GTAG

Protein sequence

MSNSIVIIGS GFAARQLVKN IRKQDASIPL TLIAADSMDE YNKPDLSHVI SQGQRADDLT 
RQTAGEFAEQ FNLRLFPHTW VTDIDAEAHV VKSQNNQWQY DKLVLATGAS AFVPPVPGRE 
LMLTLNSQQE YRACETQLRD ARRVLIVGGG LIGSELAMDF CRAGKAVTLI DNAASILASL 
MPPEVSSRLQ HRLTEMGVHL LLKSQLQGLE KTDSGILATL ECQRCIEVDA VIAATGLRPE 
TALARRAGLT INRGVCVDSY LQTSNADIYA LGDCAEINGQ VLPFLQPIQL SAMVLAKNLL 
GNNTPLKLPA MLVKIKTPEL PLHLAGETQR QDLRWQINTE RQGMVARGVD DADQLRAFVV 
SEDRMKEAFG LLKTLPM