Gene EcHS_A1333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1333
Symbol	narK
ID	5593634
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	1326396
End bp	1327787
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	54%
IMG OID	640920490
Product	nitrite extrusion protein 1
Protein accession	YP_001458051
Protein GI	157160733
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID	[TIGR00886] nitrite extrusion protein (nitrite facilitator)

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.000558307
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCACT CATCCGCCCC CGAAAGGGCT ACTGGAGCTG TCATTACAGA TTGGCGACCG 
GAAGATCCTG CGTTCTGGCA ACAACGCGGT CAACGTATTG CCAGCCGCAA CCTGTGGATT 
TCCGTTCCCT GTCTGCTGCT GGCGTTTTGC GTATGGATGT TGTTCAGCGC TGTTGCGGTG 
AACTTACCGA AAGTCGGTTT TAATTTTACG ACCGATCAGC TATTTATGTT GACTGCGCTG 
CCTTCGGTTT CTGGCGCGTT ATTACGTGTT CCATACTCCT TTATGGTTCC TATCTTCGGT 
GGTCGTCGCT GGACGGCGTT CAGCACCGGT ATTCTGATTA TTCCTTGCGT CTGGCTGGGT 
TTTGCCGTGC AGGATACCTC CACGCCTTAT AGCGTCTTCA TCATCATCTC TCTGCTATGC 
GGCTTTGCTG GCGCGAACTT CGCATCCAGT ATGGCAAACA TCAGCTTCTT CTTTCCGAAA 
CAGAAGCAGG GTGGCGCGCT GGGTCTGAAT GGTGGTCTGG GAAACATGGG CGTCAGCGTC 
ATGCAGTTGG TTGCTCCGCT GGTGGTATCA CTGTCGATTT TCGCAGTATT TGGTAGCCAG 
GGCGTCAAAC AGCCGGATGG GACTGAGCTG TATCTGGCGA ATGCGTCCTG GATATGGGTG 
CCGTTCCTTG CCATCTTCAC CATTGCGGCG TGGTTTGGCA TGAACGATCT TGCTACCTCG 
AAAGCCTCCA TCAAGGAGCA GTTGCCGGTA CTCAAACGGG GTCATCTGTG GATTATGAGC 
CTGCTGTATC TGGCAACCTT CGGCTCCTTC ATCGGCTTCT CCGCGGGCTT TGCAATGCTG 
TCAAAAACGC AGTTCCCGGA TGTTCAGATT CTGCAATACG CTTTCTTCGG GCCGTTTATT 
GGTGCGCTGG CGCGTTCTGC AGGTGGTGCA TTATCTGACC GTCTGGGCGG AACTCGTGTC 
ACGCTGGTGA ACTTTATTCT GATGGCGATT TTCAGCGGCC TGCTGTTCCT GACCTTACCG 
ACTGACGGGC AGGGCGGAAG CTTCATGGCG TTCTTCGCGG TCTTCCTGGC GCTGTTCCTG 
ACAGCTGGGC TGGGTAGTGG TTCCACTTTC CAGATGATTT CAGTGATCTT CCGTAAACTG 
ACAATGGATC GCGTGAAAGC AGAAGGGGGT TCTGACGAAC GTGCGATGCG TGAAGCGGCA 
ACCGACACGG CGGCGGCGCT GGGTTTCATC TCTGCGATTG GCGCGATTGG TGGCTTCTTT 
ATCCCGAAAG CGTTTGGTAG CTCGCTGGCA TTAACGGGTT CGCCAGTCGG CGCAATGAAG 
GTATTTTTGA TTTTCTATAT CGCCTGCGTA GTGATTACCT GGGCGGTATA TGGTCGGCAT 
TCTAAAAAAT AA

Protein sequence

MSHSSAPERA TGAVITDWRP EDPAFWQQRG QRIASRNLWI SVPCLLLAFC VWMLFSAVAV 
NLPKVGFNFT TDQLFMLTAL PSVSGALLRV PYSFMVPIFG GRRWTAFSTG ILIIPCVWLG 
FAVQDTSTPY SVFIIISLLC GFAGANFASS MANISFFFPK QKQGGALGLN GGLGNMGVSV 
MQLVAPLVVS LSIFAVFGSQ GVKQPDGTEL YLANASWIWV PFLAIFTIAA WFGMNDLATS 
KASIKEQLPV LKRGHLWIMS LLYLATFGSF IGFSAGFAML SKTQFPDVQI LQYAFFGPFI 
GALARSAGGA LSDRLGGTRV TLVNFILMAI FSGLLFLTLP TDGQGGSFMA FFAVFLALFL 
TAGLGSGSTF QMISVIFRKL TMDRVKAEGG SDERAMREAA TDTAAALGFI SAIGAIGGFF 
IPKAFGSSLA LTGSPVGAMK VFLIFYIACV VITWAVYGRH SKK