Gene EcSMS35_1918 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1918
Symbol	narX
ID	6145880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1940010
End bp	1941806
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	53%
IMG OID	641616794
Product	nitrate/nitrite sensor protein NarX
Protein accession	YP_001743970
Protein GI	170682187
COG category	[T] Signal transduction mechanisms
COG ID	[COG3850] Signal transduction histidine kinase, nitrate/nitrite-specific
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0184147
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.168413
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTAAAC GTTGTCTCTC TCCGCTCACC CTGGTTAATC AGGTTGCGCT TATTGTGTTG 
CTTTCTACTG CTATTGGACT GGCAGGGATG GCAGTTTCTG GCTGGCTGGT GCAAGGCGTT 
CAGGGCAGCG CCCATGCGAT CAACAAAGCG GGATCGCTGC GCATGCAAAG TTACCGTCTG 
TTGGCGGCAG TGCCATTAAG CGAGAAAGAC AAGCCCTTAA TTAAAGAAAT GGAACAAACG 
GCATTTAGCG CCGAGTTGAC TCGAGCAGCG GAACGAGACG GACAACTGGC GCAATTACAG 
GGTTTACAAG ATTACTGGCG TAATGAACTG ATCCCTGCGC TGATGCGTGC ACAAAACCGC 
GAAACGGTGT CAGCGGATGT CAGCCAGTTT GTTGCCGGGC TTGATCAGCT GGTATCTGGT 
TTTGACCGCA CCACGGAAAT GCGCATTGAG ACAGTGGTAC TGGTCCATCG GGTAATGGCG 
GTATTTATGG CACTTTTACT GGTGTTCACT ATTATCTGGT TGCGGGCGCG ACTGCTACAA 
CCGTGGCGGC AACTGCTGGC AATGGCGAGT GCCGTCAGCC ATCGCGATTT TACCCAACGC 
GCAAACATCA GCGGGCGCAA CGAAATGGCG ATGCTTGGAA CTGCATTGAA CAATATGTCT 
GCAGAACTGG CCGAAAGTTA TGCCGTACTT GAGCAGCGGG TTCAGGAGAA AACTGCCGGG 
CTGGAGCATA AAAATCAGAT CCTCTCTTTT TTATGGCAGG CTAACCGCCG TTTGCATTCC 
CGCGCCCCGC TGTGTGAACG CCTGTCACCG GTACTCAACG GCTTACAGAA TTTAACCCTG 
CTACGTGATA TCGAACTGCG GGTGTATGAC ACTGATGATG AAGAGAATCA TCAGGAGTTT 
ACCTGCCAGC CAGATATGAC TTGTGATGAT AAAGGCTGCC AGCTCTGCCC GCGCGGCATA 
TTACCCGTTG GCGATCGCGG CACAACCCTG AAGTGGCGGC TGGCTGACTC TCATACGCAG 
TACGGTATTT TGCTGGCGAC CCTGCCGCAG GGGCGTCATC TTAGCCATGA TCAACAACAA 
CTGGTGGATA CCCTGGTTGA ACAACTCACC GCCACGCTGG CGCTGGATCG CCATCAGGAA 
CGTCAGCAAC AGTTGATCGT GATGGAAGAG CGTGCCACCA TTGCGCGCGA ACTGCATGAT 
TCTATTGCCC AATCTCTCTC TTGCATGAAG ATGCAGGTGA GTTGTTTACA GATGCAGGGC 
GATGCGCTGC CAGAAAGCAG CCGCGAACTG TTAAGTCAGA TCCGTAACGA ACTGAATGCA 
TCCTGGGCGC AGTTGCGTGA ATTGCTCACC ACATTCCGTT TGCAGCTCAC CGAGCCTGGA 
TTACGTCCGG CGCTGGAGGC GAGTTGCGAA GAGTACAGCG CCAAATTTGG CTTCCCGGTG 
AAGCTGGATT ATCAATTGCC GCCTCGTCTG GTGCCTTCGC ATCAGGCAAT CCACTTGTTG 
CAAATTGCCC GTGAGGCATT AAGTAACGCC CTCAAACATT CGCAAGCGAG TGAGGTCGTG 
GTGACGGTGG CGCAAAACGA TAATCAGGTC AAACTGACCG TCCAGGATAA CGGCTGCGGC 
GTGCCTGAAA ATGCCATCCG CAGCAATCAC TACGGCATGA TAATAATGCG CGACCGTGCG 
CAAAGTTTAC GAGGCGATTG CCGCGTCCGC CGTCGTGAAT CAGGTGGCAC CGAAGTGGTT 
GTCACCTTTA TTCCCGAAAA AACTTTCACA GACGTCCAAG GAGATACCCA TGAGTAA

Protein sequence

MLKRCLSPLT LVNQVALIVL LSTAIGLAGM AVSGWLVQGV QGSAHAINKA GSLRMQSYRL 
LAAVPLSEKD KPLIKEMEQT AFSAELTRAA ERDGQLAQLQ GLQDYWRNEL IPALMRAQNR 
ETVSADVSQF VAGLDQLVSG FDRTTEMRIE TVVLVHRVMA VFMALLLVFT IIWLRARLLQ 
PWRQLLAMAS AVSHRDFTQR ANISGRNEMA MLGTALNNMS AELAESYAVL EQRVQEKTAG 
LEHKNQILSF LWQANRRLHS RAPLCERLSP VLNGLQNLTL LRDIELRVYD TDDEENHQEF 
TCQPDMTCDD KGCQLCPRGI LPVGDRGTTL KWRLADSHTQ YGILLATLPQ GRHLSHDQQQ 
LVDTLVEQLT ATLALDRHQE RQQQLIVMEE RATIARELHD SIAQSLSCMK MQVSCLQMQG 
DALPESSREL LSQIRNELNA SWAQLRELLT TFRLQLTEPG LRPALEASCE EYSAKFGFPV 
KLDYQLPPRL VPSHQAIHLL QIAREALSNA LKHSQASEVV VTVAQNDNQV KLTVQDNGCG 
VPENAIRSNH YGMIIMRDRA QSLRGDCRVR RRESGGTEVV VTFIPEKTFT DVQGDTHE