Gene ECH74115_1707 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1707
Symbol	narK
ID	6972216
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	1644799
End bp	1646190
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	53%
IMG OID	643385664
Product	nitrite extrusion protein 1
Protein accession	YP_002270158
Protein GI	209400219
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID	[TIGR00886] nitrite extrusion protein (nitrite facilitator)

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0135678
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCACT CATCCGCCCC CGAAAGGGCT ACTGGAGCTG TCATTACAGA TTGGCGACCG 
GAAGATCCTG CGTTCTGGCA ACAACGCGGT CAACGTATTG CCAGCCGCAA CCTGTGGATT 
TCCGTTCCCT GTCTGCTGCT GGCGTTTTGC GTATGGATGT TGTTCAGCGC TGTTGCGGTG 
AACTTACCGA AAGTCGGTTT TAATTTTACG ACCGATCAGC TATTTATGTT GACTGCGTTG 
CCTTCGGTTT CTGGCGCGTT ATTACGTGTT CCATACTCCT TTATGGTTCC TATCTTCGGT 
GGTCGTCGCT GGACGGCGTT CAGCACCGGT ATTCTGATTA TTCCTTGTGT CTGGCTGGGT 
TTTGCCGTGC AGGATACCTC CACGCCTTAT AGCGTCTTCA TCATCATCTC TCTGCTGTGC 
GGCTTTGCTG GCGCGAACTT CGCATCCAGT ATGGCAAACA TCAGCTTCTT CTTTCCGAAA 
CAGAAGCAGG GTGGCGCGCT GGGCCTGAAT GGTGGTCTGG GCAACATGGG CGTTAGCGTT 
ATGCAGTTGG TTGCTCCGCT GGTGGTATCA CTGTCGATTT TCGCAGTATT TGGTAGCCAG 
GGCGTCAAAC AGCCGGATGG GACTGAGCTG TATCTGGCGA ATGCGTCCTG GATATGGGTG 
CCGTTCCTTG CCATCTTCAC CATTGCGGCG TGGTTTGGCA TGAACGATCT TGCTACCTCG 
AAAGCCTCCA TCAAGGAGCA GTTGCCGGTA CTCAAACGGG GTCATCTGTG GATTATGAGC 
CTGCTGTATC TGGCAACCTT CGGTTCCTTC ATCGGCTTCT CCGCGGGCTT TGCGATGCTG 
TCAAAAACGC AGTTCCCGGA TGTTCAGATT CTGCAATACG CTTTCTTCGG GCCGTTTATT 
GGTGCGCTGG CGCGTTCTGC AGGTGGTGCA TTATCTGACC GTCTGGGCGG AACTCGTGTC 
ACGCTGGTGA ACTTTATTCT GATGGCGATT TTCAGCGGCC TGCTGTTCCT GACCTTACCG 
ACTGACGGGC AGGGCGGAAG CTTCATGGCG TTCTTCGCGG TCTTCCTGGC GCTGTTCCTG 
ACAGCTGGGC TGGGTAGTGG TTCCACTTTC CAGATGATTT CCGTGATCTT CCGTAAACTG 
ACAATGGATC GCGTGAAAGC AGAAGGGGGT TCTGACGAAC GTGCGATGCG TGAAGCGGCA 
ACCGACACGG CGGCGGCGTT GGGTTTCATC TCTGCGATTG GCGCGATTGG TGGCTTCTTT 
ATCCCGAAAG CGTTCGGTAG CTCGCTGGCA TTAACGGGTT CGCCAGTCGG CGCAATGAAA 
GTATTTTTGA TTTTCTATAT CGCCTGCGTA GTGATTACCT GGGCGGTATA TGGTCGGCAT 
TCTAAAAAAT AA

Protein sequence

MSHSSAPERA TGAVITDWRP EDPAFWQQRG QRIASRNLWI SVPCLLLAFC VWMLFSAVAV 
NLPKVGFNFT TDQLFMLTAL PSVSGALLRV PYSFMVPIFG GRRWTAFSTG ILIIPCVWLG 
FAVQDTSTPY SVFIIISLLC GFAGANFASS MANISFFFPK QKQGGALGLN GGLGNMGVSV 
MQLVAPLVVS LSIFAVFGSQ GVKQPDGTEL YLANASWIWV PFLAIFTIAA WFGMNDLATS 
KASIKEQLPV LKRGHLWIMS LLYLATFGSF IGFSAGFAML SKTQFPDVQI LQYAFFGPFI 
GALARSAGGA LSDRLGGTRV TLVNFILMAI FSGLLFLTLP TDGQGGSFMA FFAVFLALFL 
TAGLGSGSTF QMISVIFRKL TMDRVKAEGG SDERAMREAA TDTAAALGFI SAIGAIGGFF 
IPKAFGSSLA LTGSPVGAMK VFLIFYIACV VITWAVYGRH SKK