Gene ECH74115_0419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0419
Symbol
ID	6966674
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	427922
End bp	428875
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	52%
IMG OID	643384471
Product	arac-family transcriptional regulator
Protein accession	YP_002268985
Protein GI	209396742
COG category	[K] Transcription
COG ID	[COG4977] Transcriptional regulator containing an amidase domain and an AraC-type DNA-binding HTH domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000111496
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCCGC TAACTGTTGC CATTATCGCC GTTGCCGGTT TTAGTCCTTT TCACCTTTCC 
GTACCGTTTA TCGTGTTTAG TGAAAAGATG GCGGAGAAAA AACGCTTTCA CGTGATTATT 
TGCGCTGAAA AGCCGGGAAA CGTGGACTCT GCCGATGGGT TTTCCGTAAC CGCCACCCAT 
GACTATACCG CAGTCATCCA GGCAGATATT GTGATAATTC CTTACTGGGG AACCATTACA 
CAAAAACCGC CACAAAAACT GCTGGAAGCC TTAACGACCG CACGGGATAA CGGCGCACAG 
ATTGTCGGGC TTTGCCTGGG CACGTTTGTG CTCGGCTATG CAGGTTTACT GAAAAATAAG 
CGTGCCGCCA CGCACTGGGA GTTCGAGCGT GAATTTCAGG CACGTTTTCC ACAAACACAT 
CTGGATATTA ACGCGTTGTA CGTAGACGAT GACGGCATTA TTACCTCTGC CGGTACTGCC 
GCGGCGCTGG ATTGCTGTTT GTATATTGTT CGGCAACATT TTGGCAGCGA CTATGCTAAC 
CATATTGCCC GACGGATGGT CGTACCGCCA TATCGCACCG GCGGTCAGGC GCAGTTTATT 
GAGCAACCGG TGCCGAAAAA TACCCATGAT GAACGCATAA ACCTCCTGCT GGATTACCTG 
CGGCAAAACA TTGCGCAACA GCATGATCTC GACTCGCTGG CGCAGCGAGT AATGATGAGT 
CGCCGCACAT TAACTCGCCA TTTTATGAAA GCGACCGGTT CGAGTATCGC CGAATGGCTC 
ATTACTGAAC GCTTACGCCG TAGCCAGGAA CTGTTGGGAT CCAGTCAGTT GCCCGTTGAG 
CGGATAGCGG CTGAGGTGGG TTTTCTCTCA CCTGTGACCT GGCGTCAGCA TTTTAAATCT 
CACTTCGGCG TCAGCCCCGC CGAATGGCGC AAAACCTTTC GCGGTATGGC ATGA

Protein sequence

MRPLTVAIIA VAGFSPFHLS VPFIVFSEKM AEKKRFHVII CAEKPGNVDS ADGFSVTATH 
DYTAVIQADI VIIPYWGTIT QKPPQKLLEA LTTARDNGAQ IVGLCLGTFV LGYAGLLKNK 
RAATHWEFER EFQARFPQTH LDINALYVDD DGIITSAGTA AALDCCLYIV RQHFGSDYAN 
HIARRMVVPP YRTGGQAQFI EQPVPKNTHD ERINLLLDYL RQNIAQQHDL DSLAQRVMMS 
RRTLTRHFMK ATGSSIAEWL ITERLRRSQE LLGSSQLPVE RIAAEVGFLS PVTWRQHFKS 
HFGVSPAEWR KTFRGMA