Gene EcSMS35_1705 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1705
Symbol	narU
ID	6143194
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1709920
End bp	1711308
Gene Length	1389 bp
Protein Length	462 aa
Translation table	11
GC content	49%
IMG OID	641616581
Product	nitrite extrusion protein 2
Protein accession	YP_001743759
Protein GI	170682066
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID	[TIGR00886] nitrite extrusion protein (nitrite facilitator)

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0635768
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACTGC AAAATGAGAA AAATAGTCGT TATCTTTTAC GCGACTGGAA ACCAGAAAAT 
CCGGCCTTCT GGGAAAATAA AGGAAAACAT ATTGCACGAA GAAACCTCTG GATATCAGTC 
AGTTGTCTAC TTCTTGCCTT CTGTGTCTGG ATGCTATTTA GCGCAGTTAC TGTTAATCTC 
AATAAAATCG GTTTTAATTT CACTACCGAT CAACTCTTTT TATTAACCGC ATTACCCTCC 
GTTTCTGGCG CATTATTGCG TGTCCCCTAC TCCTTTATGG TGCCTATATT CGGTGGACGC 
CGATGGACGG TTTTTAGTAC TGCAATCCTG ATTATTCCTT GCGTCTGGCT CGGAATTGCC 
GTGCAGAATC CGAATACTCC TTTTGGGATA TTTATCGTTA TCGCTTTGCT ATGCGGTTTT 
GCAGGTGCGA ACTTTGCTTC GAGCATGGGC AATATCAGTT TCTTCTTCCC AAAAGCCAAA 
CAAGGGAGCG CACTTGGGAT TAATGGCGGA TTAGGAAACT TAGGTGTAAG TGTGATGCAG 
CTGGTTGCAC CGCTGGTCAT TTTTGTACCC GTATTTGCCT TTCTCGGCGT CAATGGCGTA 
CCGCAGGCCG ACGGTTCGGT AATGTCGCTG GCGAATGCCG CATGGATTTG GGTGCCATTA 
CTGGCGATTG CCACGATCGC CGCCTGGTCA GGGATGAATG ATATCGCCAG TTCACGCGCG 
TCAATTGCCG ACCAGCTGCC AGTGTTACAA CGCCTGCATC TCTGGCTGCT GAGCCTGCTT 
TACCTTGCCA CCTTCGGTTC GTTTATCGGT TTTTCTGCGG GTTTTGCCAT GCTGGCGAAA 
ACTCAGTTCC CGGATGTGAA TATTCTGCGC CTGGCGTTCT TTGGCCCATT TATCGGTGCC 
ATCGCGCGAT CGCTTGGTGG TGCTATTTCC GATAAATTCG GCGGCGTGCG GGTGACGTTG 
ATCAACTTCA TTTTTATGGC GATTTTCAGC GCCCTGCTGT TCCTTACCTT ACCGGGCACA 
GGCTCCGGTA ATTTCATCGC ATTTTACGCC GTATTTATGG GGCTGTTTCT GACCGCGGGT 
CTGGGAAGTG GTTCTACTTT CCAGATGATC GCCGTCATCT TTCGCCAGAT AACCATTTAT 
CGGGTGAAGA TGAAAGGCGG TAGTGATGAG CAAGCTCAAA GAGAAGCCGT CACCGAAACG 
GCAGCCGCTC TGGGCTTTAT CTCAGCCATT GGCGCAGTGG GCGGCTTTTT TATTCCGCAG 
GCGTTTGGCA TGTCGCTCAA TATGACCGGC TCTCCGGTGG GCGCGATGAA AGTGTTTTTA 
ATCTTCTACA TCGTTTGTGT GCTGCTGACC TGGCTGGTTT ATGGTCGGCG GAAGTTCAGC 
CAAAAATAA

Protein sequence

MALQNEKNSR YLLRDWKPEN PAFWENKGKH IARRNLWISV SCLLLAFCVW MLFSAVTVNL 
NKIGFNFTTD QLFLLTALPS VSGALLRVPY SFMVPIFGGR RWTVFSTAIL IIPCVWLGIA 
VQNPNTPFGI FIVIALLCGF AGANFASSMG NISFFFPKAK QGSALGINGG LGNLGVSVMQ 
LVAPLVIFVP VFAFLGVNGV PQADGSVMSL ANAAWIWVPL LAIATIAAWS GMNDIASSRA 
SIADQLPVLQ RLHLWLLSLL YLATFGSFIG FSAGFAMLAK TQFPDVNILR LAFFGPFIGA 
IARSLGGAIS DKFGGVRVTL INFIFMAIFS ALLFLTLPGT GSGNFIAFYA VFMGLFLTAG 
LGSGSTFQMI AVIFRQITIY RVKMKGGSDE QAQREAVTET AAALGFISAI GAVGGFFIPQ 
AFGMSLNMTG SPVGAMKVFL IFYIVCVLLT WLVYGRRKFS QK