Gene EcSMS35_4454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4454
Symbol	zraR
ID	6142865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4547824
End bp	4549149
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	57%
IMG OID	641619273
Product	transcriptional regulatory protein ZraR
Protein accession	YP_001746389
Protein GI	170680150
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.209341
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.000519331
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGCACG ATAATATCGA TATTCTGGTG GTGGATGATG ACATTAGCCA CTGCACTATT 
TTGCAGGCTT TACTGCGCGG CTGGGGCTAT AACGTCGCGC TGGCGAACAG CGGGCGACAG 
GCGCTGGAGC AGGTGCGGGA ACAGGTTTTT GATCTTGTGC TTTGCGATGT GCGAATGGCA 
GAGATGGACG GCATCGCCAC GCTCAAAGAG ATCAAAGCGT TAAATCCGGC AATTCCGGTA 
CTGATTATGA CCGCGTACTC CAGCGTCGAG ACGGCGGTAG AGGCGTTGAA AACCGGGGCG 
CTGGATTATC TCATCAAGCC GCTGGATTTC GATAACCTGC AGGCGACGCT GGAAAAGGCC 
CTCGCGCATA CGCACAGTAT TGACGCTGAA ACGCCTGCGG TGTCTGCCAG CCAGTTCGGT 
ATGGTCGGTA AAAGCCCGGC GATGCAACAC CTGCTCAGTG AAATCGCCCT CGTCGCGCCA 
TCGGAAGCCA CGGTGCTGAT CCATGGCGAT TCCGGCACCG GTAAAGAGCT GGTCGCCAGG 
GCGATTCACG CCAGTAGCGC ACGGAGTGAA AAACCACTGG TAACGCTCAA CTGTGCGGCA 
CTCAACGAAT CCTTGCTGGA ATCTGAATTG TTCGGTCACG AAAAAGGGGC GTTTACCGGG 
GCCGACAAAC GGCGGGAGGG GCGCTTTGTT GAGGCGGACG GCGGCACGTT GTTTCTCGAT 
GAAATTGGCG ATATCTCGCC GATGATGCAG GTGCGTCTGC TACGTGCGAT TCAGGAGCGC 
GAAGTTCAGC GTGTCGGCAG CAACCAGACC ATCTCGGTTG ATGTCCGGCT GATTGCGGCG 
ACTCATCGCG ATCTTGCCGC AGAGGTGAAT GCCGGGCGTT TTCGCCAGGA TCTCTACTAT 
CGCCTGAACG TGGTGGCGAT TGAAGTTCCG TCGCTGCGTC AGCGGCGGGA AGATATTCCT 
CTGCTGACAA ACCATTTTCT TCAGCGCTTT GCCGAGCGTA ATCGCAAGGC GGTAAAAGGT 
TTTACGCCCC AGGCGATGGA TCTGCTGATT CACTACGACT GGCCGGGAAA TATTCGTGAA 
CTGGAAAACG CGGTGGAACG GGCGGTGGTG CTGCTGACCG GGGAATATAT TTCCGAACGC 
GAGCTGCCGC TGGCGATTGC GAGTACGCCG ATCCCGCTGG TACAAAGTCA GGATATTCAG 
CCGCTGGTGG AAGTCGAAAA AGAGGTGATT CTTGCGGCAC TGGAGAAAAC GGGCGGCAAC 
AAAACCGAAG CCGCCCGTCA GTTAGGGATC ACGCGCAAAA CGCTCTTGGC AAAACTGTCG 
CGTTAG

Protein sequence

MTHDNIDILV VDDDISHCTI LQALLRGWGY NVALANSGRQ ALEQVREQVF DLVLCDVRMA 
EMDGIATLKE IKALNPAIPV LIMTAYSSVE TAVEALKTGA LDYLIKPLDF DNLQATLEKA 
LAHTHSIDAE TPAVSASQFG MVGKSPAMQH LLSEIALVAP SEATVLIHGD SGTGKELVAR 
AIHASSARSE KPLVTLNCAA LNESLLESEL FGHEKGAFTG ADKRREGRFV EADGGTLFLD 
EIGDISPMMQ VRLLRAIQER EVQRVGSNQT ISVDVRLIAA THRDLAAEVN AGRFRQDLYY 
RLNVVAIEVP SLRQRREDIP LLTNHFLQRF AERNRKAVKG FTPQAMDLLI HYDWPGNIRE 
LENAVERAVV LLTGEYISER ELPLAIASTP IPLVQSQDIQ PLVEVEKEVI LAALEKTGGN 
KTEAARQLGI TRKTLLAKLS R