Gene ECH74115_0401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0401
Symbol	prpR
ID	6971246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	407436
End bp	409022
Gene Length	1587 bp
Protein Length	528 aa
Translation table	11
GC content	55%
IMG OID	643384454
Product	propionate catabolism operon regulatory protein PrpR
Protein accession	YP_002268968
Protein GI	209397236
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG3829] Transcriptional regulator containing PAS, AAA-type ATPase, and DNA-binding domains
TIGRFAM ID	[TIGR02329] propionate catabolism operon regulatory protein PrpR

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACATC CACCACGGCT GAATGACGAC AAACCGGTTA TCTGGACGGT ATCTGTAACG 
CGCTTATTCG AGCTGTTTCG CGATATCAGC CTCGAGTTTG ATCACCTGGC GAACATTACC 
CCTATTCAGC TTGGCTTTGA AAAAGCAGTG ACCTACATCC GCAAGAAACT GGCAAACGAA 
CGCTGTGACG CCATCATCGC CGCTGGCTCT AACGGCGCGT ACCTGAAAAG CCGCCTGTCA 
GTGCCAGTTA TTTTGATTAA ACCGAGCGGC TACGATGTGT TACAGGCACT GGCAAAAGCC 
GGAAAACTCA CCTCTTCTAT CGGCGTTGTC ACTTATCAGG AAACTATTCC GGCACTGGTG 
GCGTTTCAAA AAACCTTTAA TTTGCGCCTC GATCAACGTA GCTACATTAC CGAAGAAGAC 
GCACGCGGGC AGATTAACGA GCTAAAAGCT AACGGCACCG AAGCGGTGGT CGGCGCGGGG 
CTGATTACCG ATCTGGCAGA AGAAGCCGGA ATGACCGGAA TTTTTATCTA TTCCGCCGCC 
ACCGTGCGCC AGGCGTTCAG CGATGCGCTG GATATGACGC GCATGTCGTT ACGCCATAAC 
ACTCACGATG CCACCCGCAA CGCCCTGCGT ACTCGTTACG TGCTGGGCGA TATGCTCGGT 
CAATCACCAC AGATGGAGCA GGTGCGGCAG ACTATTTTGC TGTATGCCCG CTCCAGTGCG 
GCGGTGTTGA TTGAGGGGGA AACGGGGACG GGCAAAGAGC TGGCGGCCCA GGCAATTCAT 
CGGGAATATT TTGCCCGCCA CGATGCGCGA CAGGGCAAAA AGTCGCATCC GTTTGTTGCC 
GTCAACTGCG GGGCGATTGC CGAATCGCTG CTGGAAGCGG AGCTGTTTGG CTATGAGGAA 
GGGGCGTTTA CCGGCTCGCG ACGCGGAGGT CGCGCCGGGC TGTTCGAAAT TGCCCACGGT 
GGCACGCTGT TTCTGGATGA GATTGGCGAA ATGCCGCTAC CTTTGCAGAC TCGCCTGTTA 
CGGGTGCTGG AAGAAAAAGA GGTCACCCGC GTCGGCGGGC ATCAGCCTGT TCCGGTAGAT 
GTACGGGTCA TTAGCGCCAC TCACTGCAAT CTGGAAGAAG ATATGCGGCA AGGGCAGTTT 
CGCCGTGATC TGTTTTATCG GCTGAGTATT TTGCGTCTGC AATTGCCACC ACTGCGCGAG 
CGGGTGGCAG ATATTCTTCC GCTGGCGGAA AGCTTTTTGA AAGTGTCTCT GGCGGCGCTC 
TCCGCCCCAT TTTCTGCCGC ATTACGCCAG GGATTACAGG CAAGCGAAAC CGTGCTGGTG 
CACTACGACT GGCCAGGTAA TATTCGTGAA CTGCGCAATA TGATGGAGCG ACTGGCGCTA 
TTTTTAAGTG TGGAACCGAC GCCGGATTTA ACGCCGCAGT TTTTGCAGCT GCTACTGCCG 
GAACTGGCGC GCGAGTCGGC GAAAATTCCC GCTCCACGCT TGCTGACACC ACAACAGGCA 
CTGGAGAAAT TTAATGGCGA TAAAACAGCA GCGGCGAATT ATTTAGGCAT CAGCCGGACG 
ACGTTCTGGC GGCGGCTGAA AAGCTGA

Protein sequence

MAHPPRLNDD KPVIWTVSVT RLFELFRDIS LEFDHLANIT PIQLGFEKAV TYIRKKLANE 
RCDAIIAAGS NGAYLKSRLS VPVILIKPSG YDVLQALAKA GKLTSSIGVV TYQETIPALV 
AFQKTFNLRL DQRSYITEED ARGQINELKA NGTEAVVGAG LITDLAEEAG MTGIFIYSAA 
TVRQAFSDAL DMTRMSLRHN THDATRNALR TRYVLGDMLG QSPQMEQVRQ TILLYARSSA 
AVLIEGETGT GKELAAQAIH REYFARHDAR QGKKSHPFVA VNCGAIAESL LEAELFGYEE 
GAFTGSRRGG RAGLFEIAHG GTLFLDEIGE MPLPLQTRLL RVLEEKEVTR VGGHQPVPVD 
VRVISATHCN LEEDMRQGQF RRDLFYRLSI LRLQLPPLRE RVADILPLAE SFLKVSLAAL 
SAPFSAALRQ GLQASETVLV HYDWPGNIRE LRNMMERLAL FLSVEPTPDL TPQFLQLLLP 
ELARESAKIP APRLLTPQQA LEKFNGDKTA AANYLGISRT TFWRRLKS