Gene EcHS_A1331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A1331
Symbol	narX
ID	5593632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	1324261
End bp	1326057
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	53%
IMG OID	640920488
Product	nitrate/nitrite sensor protein NarX
Protein accession	YP_001458049
Protein GI	157160731
COG category	[T] Signal transduction mechanisms
COG ID	[COG3850] Signal transduction histidine kinase, nitrate/nitrite-specific
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	0.150699
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTAAAC GTTGTCTCTC TCCGCTCACC CTGGTTAATC AGGTTGCGCT TATTGTGTTG 
CTTTCTACTG CTATTGGACT GGCAGGGATG GCGGTTTCTG GCTGGCTGGT GCAAGGCGTT 
CAGGGCAGCG CCCATGCGAT CAACAAAGCG GGATCGCTGC GCATGCAAAG TTACCGTCTG 
TTGGCAGCAT TGCCATTAAG CGAGAAAGAC AAGCCCTTAA TTAAAGAGAT GGAACAAACG 
GCATTTAGCG CCGAGTTGAC TCGAGCAGCA GAACGAGACG GACAACTGGC GCAATTACAG 
GGTTTACAAG ATTACTGGCG TAATGAACTG ATCCCTGCAC TGATGCGTGC ACAAAACCGC 
GAAACGGTGT CAGCGGATGT CAGCCAGTTT GTTGCCGGGC TTGATCAGCT GGTATCTGGT 
TTTGACCGCA CCACGGAAAT GCGCATTGAG ACAGTGGTAC TGGTCCATCG GGTAATGGCG 
GTATTTATGG CACTTTTACT GGTGTTCACT ATTATCTGGT TGCGGGCGCG ACTGCTACAA 
CCGTGGCGGC AACTGCTGGC AATGGCGAGT GCCGTCAGTC ATCGCGATTT TACCCAACGC 
GCGAACATCA GCGGGCGCAA CGAAATGGCG ATGCTTGGAA CTGCATTGAA CAATATGTCT 
GCAGAACTGG CCGAAAGTTA TGCCGTACTT GAGCAGCGGG TTCAGGAGAA AACCGCCGGG 
CTGGAGCATA AAAATCAGAT CCTCTCTTTT TTATGGCAGG CTAACCGCCG TTTGCATTCC 
CGCGCCCCGC TGTGTGAACG CCTGTCACCT GTACTCAACG GCTTACAGAA TTTAACCCTG 
CTACGTGATA TCGAATTGCG GGTGTATGAC ACTGATGATG AAGAGAATCA TCAGGAGTTT 
ACCTGCCAGC CAGATATGAC TTGTGATGAT AAAGGCTGCC AGCTCTGCCC GCGCGGCGTA 
TTACCCGTTG GCGATCGCGG CACAACCCTG AAGTGGCGGC TGGCTGACTC ACATACGCAG 
TACGGTATTT TGCTGGCGAC CCTACCGCAG GGGCGTCATC TTAGCCATGA TCAACAACAA 
CTGGTGGATA CCCTGGTTGA ACAACTCACC GCCACGCTGG CGCTGGATCG GCATCAGGAA 
CGTCAGCAAC AGTTGATCGT GATGGAAGAG CGTGCCACCA TTGCGCGCGA ACTGCATGAT 
TCTATTGCCC AATCTCTCTC TTGCATGAAG ATGCAGGTGA GTTGTTTACA GATGCAGGGC 
GATGCGCTGC CAGAAAGCAG CCGCGAACTG TTAAGTCAGA TCCGTAACGA ACTGAATGCA 
TCCTGGGCGC AGTTGCGTGA ATTGCTCACC ACATTCCGCT TGCAGCTCAC CGAGCCTGGA 
TTACGTCCGG CGCTGGAAGC GAGTTGCGAA GAGTACAGCG CCAAATTTGG CTTCCCGGTG 
AAGCTGGATT ATCAATTGCC GCCTCGTCTG GTGCCTTCAC ATCAGGCAAT CCACTTGTTG 
CAAATTGCCC GTGAGGCATT AAGTAACGCC CTCAAACATT CGCAAGCGAG TGAGGTCGTG 
GTGACGGTGG CGCAAAACGA TAATCAGGTC AAACTGACCG TCCAGGATAA CGGCTGCGGC 
GTGCCTGAAA ATGCCATCCG CAGCAATCAC TACGGCATGA TAATAATGCG CGACCGTGCG 
CAAAGTTTAC GAGGCGATTG CCGCGTCCGC CGTCGTGAAT CAGGTGGCAC CGAAGTGGTG 
GTCACCTTTA TTCCCGAAAA AACTTTCACA GACGTCCAAG GAGATACCCA TGAGTAA

Protein sequence

MLKRCLSPLT LVNQVALIVL LSTAIGLAGM AVSGWLVQGV QGSAHAINKA GSLRMQSYRL 
LAALPLSEKD KPLIKEMEQT AFSAELTRAA ERDGQLAQLQ GLQDYWRNEL IPALMRAQNR 
ETVSADVSQF VAGLDQLVSG FDRTTEMRIE TVVLVHRVMA VFMALLLVFT IIWLRARLLQ 
PWRQLLAMAS AVSHRDFTQR ANISGRNEMA MLGTALNNMS AELAESYAVL EQRVQEKTAG 
LEHKNQILSF LWQANRRLHS RAPLCERLSP VLNGLQNLTL LRDIELRVYD TDDEENHQEF 
TCQPDMTCDD KGCQLCPRGV LPVGDRGTTL KWRLADSHTQ YGILLATLPQ GRHLSHDQQQ 
LVDTLVEQLT ATLALDRHQE RQQQLIVMEE RATIARELHD SIAQSLSCMK MQVSCLQMQG 
DALPESSREL LSQIRNELNA SWAQLRELLT TFRLQLTEPG LRPALEASCE EYSAKFGFPV 
KLDYQLPPRL VPSHQAIHLL QIAREALSNA LKHSQASEVV VTVAQNDNQV KLTVQDNGCG 
VPENAIRSNH YGMIIMRDRA QSLRGDCRVR RRESGGTEVV VTFIPEKTFT DVQGDTHE