Gene ECH74115_3958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3958
Symbol	norR
ID	6967299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3658939
End bp	3660453
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	57%
IMG OID	643387728
Product	anaerobic nitric oxide reductase transcription regulator
Protein accession	YP_002272171
Protein GI	209399708
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3604] Transcriptional regulator containing GAF, AAA-type ATPase, and DNA binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTTT CCGTTGATGT GCTGGCGAAT ATCGCCATCG AATTGCAGCG TGGGATTGGT 
CATCAGGATC GTTTTCAGCG CCTGATCACC ACGCTGCGTC AGGTGCTGGA GTGCGATGCG 
TCTGCGTTGC TACGTTACGA CTCGCGGCAG TTTATTCCGC TTGCCATCGA CGGGCTGGCG 
AAGGATGTAC TCGGTAGACG CTTTGCGCTG GAAGGTCATC CACGGCTGGA AGCGATTGCC 
CGCGCGGGTG ATGTGGTGCG CTTTCCCGCA GACAGCGAAT TGCCCGATCC CTATGACGGT 
TTGATTCCAG GGCAGGAGAG TCTGAAGGTT CACGCCTGCG TTGGTCTGCC GCTGTTTGCC 
GGGCAAAACC TGATCGGCGC ATTGACGCTC GACGGGATGC AGCCCGATCA GTTCGATGTT 
TTCAGCGACG AAGAGTTACG CCTGATTGCC GCGCTGGCGG CGGGAGCGTT AAGCAATGCG 
TTGCTGATTG AACAACTGGA AAGCCAGAAT ATGCTGCCGG GCGATGCCGC TCCATTTGAA 
GCGGTGAAAC AGACGCAGAT GATCGGTCTG TCGCCAGGCA TGACGCAACT GAAAAAAGAG 
ATTGAGATTG TGGCGGCGTC CGATCTCAAC GTCCTGATCA GCGGTGAGAC GGGAACCGGT 
AAGGAGCTGG TGGCGAAAGC GATTCATGAG GCCTCGCCAC GGGCGGTGAA TCCGCTGGTC 
TATCTCAACT GTGCCGCACT GCCGGAAAGT GTGGCGGAAA GTGAGTTGTT CGGGCATGTG 
AAAGGAGCGT TTACTGGCGC TATCAGTAAC CGCAGTGGGA AGTTTGAAAT GGCGGATAAC 
GGCACGCTGT TTCTCGATGA GATCGGCGAG TTGTCGTTGG CATTGCAGGC CAAGCTGCTG 
AGGGTGTTGC AGTATGGCGA TATTCAGCGC GTTGGCGATG ACCGTAGTTT GCGGGTCGAT 
GTGCGCGTGC TGGCGGCGAC TAACCGCGAC TTACGCGAAG AGGTGCTGGC AGGGCGATTC 
CGCGCCGATT TGTTTCATCG CCTGAGTGTG TTTCCACTTT CGGTGCCGCC GCTGCGTGAG 
CGGGGCGATG ATGTCATTCT GCTGGCGGGG TATTTCTGCG AGCAGTGTCG TTTGCGGCAG 
GGGCTCTCCC GCGTGGTATT AAGTGCCGGG GCGCGAAATT TACTGCAACA CTACAGTTTT 
CCGGGAAACG TGCGCGAACT GGAACATGCT ATTCATCGGG CGGTAGTGCT GGCGAGAGCC 
ACCCGCAGCG GCGATGAAGT GATTCTTGAG GCGCAACATT TTGCTTTTCC TGAGGTGACG 
TTGCCGCCGC CAGAAGTGGC GGCGGTGCCC GTTGTTAAGC AAAACCTGCG TGAAGCGACA 
GAAGCGTTCC AGCGTGAAAC TATTCGTCAG GCACTGGCAC AAAATCATCA CAACTGGGCT 
GCCTGCGCGC GGATGCTGGA AACCGACGTC GCCAACCTGC ATCGGCTGGC GAAACGTCTG 
GGATTGAAGG ATTAA

Protein sequence

MSFSVDVLAN IAIELQRGIG HQDRFQRLIT TLRQVLECDA SALLRYDSRQ FIPLAIDGLA 
KDVLGRRFAL EGHPRLEAIA RAGDVVRFPA DSELPDPYDG LIPGQESLKV HACVGLPLFA 
GQNLIGALTL DGMQPDQFDV FSDEELRLIA ALAAGALSNA LLIEQLESQN MLPGDAAPFE 
AVKQTQMIGL SPGMTQLKKE IEIVAASDLN VLISGETGTG KELVAKAIHE ASPRAVNPLV 
YLNCAALPES VAESELFGHV KGAFTGAISN RSGKFEMADN GTLFLDEIGE LSLALQAKLL 
RVLQYGDIQR VGDDRSLRVD VRVLAATNRD LREEVLAGRF RADLFHRLSV FPLSVPPLRE 
RGDDVILLAG YFCEQCRLRQ GLSRVVLSAG ARNLLQHYSF PGNVRELEHA IHRAVVLARA 
TRSGDEVILE AQHFAFPEVT LPPPEVAAVP VVKQNLREAT EAFQRETIRQ ALAQNHHNWA 
ACARMLETDV ANLHRLAKRL GLKD