Gene EcHS_A4238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4238
Symbol	zraR
ID	5595423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4232881
End bp	4234206
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	56%
IMG OID	640923342
Product	transcriptional regulatory protein ZraR
Protein accession	YP_001460791
Protein GI	157163473
COG category	[T] Signal transduction mechanisms
COG ID	[COG2204] Response regulator containing CheY-like receiver, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	0.020936
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCACG ATAATATCGA TATTCTGGTG GTGGATGATG ACATTAGCCA CTGCACTATT 
TTGCAGGCTT TACTGCGCGG CTGGGGCTAT AACGTCGCGC TGGCGAACAG CGGGCGACAG 
GCGCTGGAGC AGGTGCGGGA ACAGGTTTTT GATCTTGTGC TTTGCGATGT GCGAATGGCG 
GAGATGGACG GCATCGCCAC GCTGAAAGAG ATCAAAGCGT TAAACCCGGC AATTCCGGTG 
CTGATTATGA CTGCGTACTC CAGCGTCGAG ACGGCGGTAG AGGCACTGAA AACTGGGGCG 
CTGGATTATC TCATCAAGCC GCTGGATTTC GATAACCTAC AGGCGACGCT GGAAAAGGCG 
CTCGCGCATA CGCACAGTAT TGATGCTGAA ACACCTGCGG TGACTGCCAG CCAGTTCGGT 
ATGGTCGGTA AAAGCTCGGC GATGCAACAC CTGCTCAGTG AAATCGCCCT CGTCGCGCCA 
TCGGAAGCCA CGGTACTGAT CCACGGCGAT TCCGGCACCG GTAAAGAGCT GGTCGCCAGG 
GCGATTCACG CCAGTAGCGC ACGTAGCGAA AAACCGCTGG TAACGCTCAA CTGTGCGGCA 
CTCAACGAAT CCTTGCTGGA ATCTGAATTG TTCGGTCACG AAAAAGGGGC GTTTACTGGA 
GCCGATAAAC GCCGGGAAGG GCGCTTTGTT GAGGCGGACG GCGGCACGCT GTTTCTCGAT 
GAAATTGGCG ATATCTCGCC GATGATGCAG GTGCGTCTGC TGCGTGCGAT TCAGGAGCGC 
GAAGTTCAGC GTGTCGGTAG CAACCAGACT ATCTCGGTTG ATGTCCGGCT GATTGCGGCG 
ACCCATCGCG ATCTTGCCGC AGAGGTGAAT GCCGGGCATT TTCGCCAGGA TCTCTACTAT 
CGCCTGAATG TGGTGGCGAT TGAAGTACCA TCGCTGCGGC AACGGCGGGA AGATATCCCT 
CTGCTGGCTG GCCATTTTCT TCAGCGCTTT GCCGAGCGTA ATCGCAAGGC GGTAAAAGGC 
TTTACGCCAC AGGCGATGGA TTTGCTGATC CACTACGACT GGCCGGGAAA TATTCGTGAA 
CTGGAAAACG CGGTGGAACG GGCGGTGGTG CTGCTGACCG GGGAATATAT TTCCGAACGC 
GAGCTGCCGC TGGCGATTGC CGGTACGCCG ATCCCGCTGG GGCAAAGTCA GGATATTCAG 
CCGCTGGTAG AAGTCGAAAA AGAAGTGATT CTGGCGGCAC TGGAGAAAAC GGGCGGCAAC 
AAAACCGAGG CCGCCCGTCA GTTAGGGATC ACGCGCAAAA CGCTATTGGC AAAACTGTCG 
CGTTAG

Protein sequence

MTHDNIDILV VDDDISHCTI LQALLRGWGY NVALANSGRQ ALEQVREQVF DLVLCDVRMA 
EMDGIATLKE IKALNPAIPV LIMTAYSSVE TAVEALKTGA LDYLIKPLDF DNLQATLEKA 
LAHTHSIDAE TPAVTASQFG MVGKSSAMQH LLSEIALVAP SEATVLIHGD SGTGKELVAR 
AIHASSARSE KPLVTLNCAA LNESLLESEL FGHEKGAFTG ADKRREGRFV EADGGTLFLD 
EIGDISPMMQ VRLLRAIQER EVQRVGSNQT ISVDVRLIAA THRDLAAEVN AGHFRQDLYY 
RLNVVAIEVP SLRQRREDIP LLAGHFLQRF AERNRKAVKG FTPQAMDLLI HYDWPGNIRE 
LENAVERAVV LLTGEYISER ELPLAIAGTP IPLGQSQDIQ PLVEVEKEVI LAALEKTGGN 
KTEAARQLGI TRKTLLAKLS R