Gene ECH74115_0418 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0418
Symbol	lacI
ID	6971684
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	426803
End bp	427885
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	56%
IMG OID	643384470
Product	lac repressor
Protein accession	YP_002268984
Protein GI	209395817
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000822114
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAACCAG TAACGCTATA CGATGTCGCA GAGTATGCCG GTGTCTCTTA TCAGACCGTT 
TCCCGCGTGG TGAATCAGGC CAGCCACGTT TCTGCGAAAA CGCGGGAAAA AGTGGAAGCG 
GCGATGGCGG AGCTGAATTA CATTCCCAAC CGCGTGGCAC AACAACTGGC GGGGAAACAG 
TCGTTGCTGA TTGGCGTTGC CACCTCCAGT CTGGCCCTGC ACGCGCCGTC GCAAATTGTC 
GCGGCGATTA AATCTCGCGC CGATCAACTG GGTGCCAGCG TGGTGGTGTC GATGGTAGAA 
CGAAGCGGCG TCGAAGCCTG TAAAGCGGCA GTGCACAATC TTCTCGCGCA ACGCGTCAGT 
GGGCTGATCA TTAACTATCC GCTGGATGAC CAGGATGCCA TTGCTGTGGA AGCTGCCTGC 
GCTAATGTTC CGGCGTTATT TCTTGATGTC TCTGACCAGA CTCCCATCAA CAGTATTATT 
TTCTCCCATG AAGACGGTAC GCGACTGGGC GTGGAGCATC TGGTCGCATT GGGTCACCAG 
CAAATCGCGC TGTTAGCGGG CCCATTAAGT TCTGTCTCGG CGCGTCTGCG TCTGGCGGGC 
TGGCATAAAT ATCTCACTCG CAATCAAATT CAGCCGATAG CGGAACGGGA GGGCGACTGG 
AGTGCCATGT CCGGTTTTCA ACAAACCATG CAAATGCTAA ATGAGGGCAT CGTTCCCACT 
GCGATGCTGG TTGCCAACGA TCAGATGGCG CTGGGCGCAA TGCGCGCCAT TACCGAGTCC 
GGGTTGCGCG TTGGTGCGGA TATCTCGGTA GTGGGATACG ACGATACCGA AGACAGCTCG 
TGTTATATCC CGCCGTTAAC CACCATCAAA CAGGATTTTC GCCTGCTGGG GCAAACCAGC 
GTGGACCGCT TGCTGCAACT CTCTCAGGGC CAGGCGGTGA AGGGCAATCA GCTGTTGCCC 
GTCTCACTGG TGAAAAGAAA AACCACCCTG GCGCCCAAGA CGCAAACCGC TTCTCCCCGC 
GCGTTGGCCG ATTCATTAAT GCAGCTGGCA CGACAAGTTT CCCGACTGGA AAGCGGGCAG 
TGA

Protein sequence

MKPVTLYDVA EYAGVSYQTV SRVVNQASHV SAKTREKVEA AMAELNYIPN RVAQQLAGKQ 
SLLIGVATSS LALHAPSQIV AAIKSRADQL GASVVVSMVE RSGVEACKAA VHNLLAQRVS 
GLIINYPLDD QDAIAVEAAC ANVPALFLDV SDQTPINSII FSHEDGTRLG VEHLVALGHQ 
QIALLAGPLS SVSARLRLAG WHKYLTRNQI QPIAEREGDW SAMSGFQQTM QMLNEGIVPT 
AMLVANDQMA LGAMRAITES GLRVGADISV VGYDDTEDSS CYIPPLTTIK QDFRLLGQTS 
VDRLLQLSQG QAVKGNQLLP VSLVKRKTTL APKTQTASPR ALADSLMQLA RQVSRLESGQ