Gene EcSMS35_1916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1916
Symbol	narK
ID	6145199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	1938280
End bp	1939671
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	54%
IMG OID	641616792
Product	nitrite extrusion protein 1
Protein accession	YP_001743968
Protein GI	170682669
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID	[TIGR00886] nitrite extrusion protein (nitrite facilitator)

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0184588
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	0.196505
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCACT CATCCGCCCC CGAAAGGGCT ACTGGAGCTG TCATTACAGA TTGGCGACCG 
GAAGATCCTG CGTTCTGGCA ACAACGCGGT CAACGTATTG CCAGCCGCAA CCTGTGGATT 
TCCGTTCCCT GTCTGCTGCT GGCGTTTTGC GTATGGATGT TGTTCAGCGC TGTTGCGGTG 
AACTTACCGA AAGTCGGTTT TAATTTTACG ACCGATCAGC TATTTATGTT GACTGCGCTG 
CCTTCGGTTT CTGGCGCGTT ATTACGTGTT CCATACTCCT TTATGGTTCC TATCTTCGGT 
GGTCGTCGCT GGACGGCGTT CAGCACCGGT ATTCTGATTA TTCCTTGCGT CTGGCTGGGT 
TTTGCCGTGC AGGATACCTC CACGCCTTAT AGCGTCTTCA TCATCATCTC TCTGCTGTGC 
GGCTTTGCTG GCGCGAACTT CGCATCCAGT ATGGCAAACA TCAGCTTCTT CTTTCCGAAA 
CAGAAGCAGG GTGGCGCGCT GGGTCTGAAT GGTGGTCTGG GCAACATGGG CGTCAGCGTC 
ATGCAGTTGG TTGCTCCGCT GGTGGTATCA CTGTCGATTT TCGCAGTATT TGGTAGCCAG 
GGTGTCAAAC AGCCGGATGG GACTGAGCTG TATCTGGCGA ATGCGTCCTG GGTATGGGTG 
CCGTTCCTTG CCATCTTCAC CATTGCGGCG TGGTTTGGCA TGAACGATCT TGCTACCTCG 
AAAGCCTCCA TCAAGGAGCA GTTGCCGGTA CTCAAACGGG GTCATCTGTG GATTATGAGC 
CTGCTGTATC TGGCAACCTT CGGCTCCTTC ATCGGCTTCT CCGCGGGCTT TGCGATGCTG 
TCAAAAACGC AGTTCCCGGA TGTTCAGATT CTGCAATACG CTTTCTTCGG GCCGTTTATT 
GGTGCGCTGG CGCGTTCTGC AGGTGGTGCA TTATCTGACC GTCTGGGCGG AACTCGTGTC 
ACGCTGGTGA ACTTTATCCT GATGGCGATT TTCAGCGGCC TGCTGTTCCT GACCTTACCG 
ACTGACGGAC AGGGCGGAAG CTTCATGGCG TTCTTCGCAG TCTTCCTGGC GCTGTTCCTG 
ACAGCTGGGC TGGGTAGTGG TTCCACTTTC CAGATGATTT CCGTGATCTT CCGTAAACTG 
ACAATGGATC GCGTGAAAGC AGAAGGGGGT TCTGACGAAC GTGCGATGCG TGAAGCGGCA 
ACCGACACGG CGGCGGCGCT GGGTTTCATC TCTGCGATTG GCGCGATTGG TGGCTTCTTT 
ATCCCGAAAG CGTTTGGTAG CTCGCTGGCA TTAACGGGTT CGCCAGTCGG CGCAATGAAA 
GTATTTTTGA TTTTCTATAT CGCCTGCGTG GTGATTACCT GGGCGGTATA TGGTCGGCAT 
TCTAAAAAAT AA

Protein sequence

MSHSSAPERA TGAVITDWRP EDPAFWQQRG QRIASRNLWI SVPCLLLAFC VWMLFSAVAV 
NLPKVGFNFT TDQLFMLTAL PSVSGALLRV PYSFMVPIFG GRRWTAFSTG ILIIPCVWLG 
FAVQDTSTPY SVFIIISLLC GFAGANFASS MANISFFFPK QKQGGALGLN GGLGNMGVSV 
MQLVAPLVVS LSIFAVFGSQ GVKQPDGTEL YLANASWVWV PFLAIFTIAA WFGMNDLATS 
KASIKEQLPV LKRGHLWIMS LLYLATFGSF IGFSAGFAML SKTQFPDVQI LQYAFFGPFI 
GALARSAGGA LSDRLGGTRV TLVNFILMAI FSGLLFLTLP TDGQGGSFMA FFAVFLALFL 
TAGLGSGSTF QMISVIFRKL TMDRVKAEGG SDERAMREAA TDTAAALGFI SAIGAIGGFF 
IPKAFGSSLA LTGSPVGAMK VFLIFYIACV VITWAVYGRH SKK