Gene ECH74115_3285 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3285
Symbol	galS
ID	6970931
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3016983
End bp	3018023
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	52%
IMG OID	643387098
Product	DNA-binding transcriptional regulator GalS
Protein accession	YP_002271562
Protein GI	209396373
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.912253
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACCA TTCGTGATGT AGCGCGTCAG GCTGGCGTCT CTGTGGCAAC GGTTTCCCGG 
GTGCTCAATA ACAGCACGCT GGTCAGTGCC GACACGCGTG AAGCAGTAAT GAAAGCCGTG 
AGTGAGCTGG ATTATCGGCC AAACGCCAAT GCCCAGGCGC TGGCAACTCA GGTTAGCGAC 
ACCATTGGCG TGGTGGTGAT GGACGTTTCT GATGCGTTTT TCGGCGCGCT GGTAAAAGCG 
GTGGATCTGG TCGCTCAGCA GCATCAGAAA TACGTGCTAA TCGGCAATAG CTATCATGAA 
GCGGAAAAAG AGCGTCACGC CATTGAGGTG TTAATTCGCC AGCGTTGTAA TGCGTTGATT 
GTTCACTCAA AAGCATTGAG TGACGATGAA CTGGCGCAAT TTATGGATAA CATTCCCGGT 
ATGGTGTTAA TCAACCGCGT TGTGCCGGGG TACACCCATC GTTGCGTTTG CCTGGATAAT 
CTCAGCGGTG CCCGAATGGC GACGCGCATG TTGCTGAATA ACGGTCATCA ACGTATTGGT 
TATCTTTCTT CCAGCCACGG CATTGAAGAT GACGCCATGC GTAAAGCAGG CTGGATGAGT 
GCGTTGAAAG AGCAGGATAT TATTCCGCCG GAAAGCTGGA TTGGCACTGG TACGCCGGAC 
ATGCCGGGCG GTGAGGCGGC GATGGTTGAA CTGCTGGGGC GCAATCTACA ACTTACCGCT 
GTATTTGCTT ATAACGACAA TATGGCTGCT GGCGCACTGA CAGCATTAAA AGATAATGGC 
ATTGCGATTC CGTTACATCT CTCAATCATC GGTTTCGATG ATATTCCCAT CGCCCGTTAC 
ACCGACCCGC AATTAACGAC CGTGCGTTAT CCCATTGCTT CAATGGCGAA ATTAGCCACC 
GAACTGGCCT TGCAGGGGGC AGCAGGCAAT ATTGATCCTC GTGCCAGCCA CTGTTTTATG 
CCGACGTTAG TGCGTCGCCA TTCTGTCGCA ACACGCCAGA ATGCGGCGGC GATCACTAAC 
TCAACAAATC AGGCGATGTA A

Protein sequence

MITIRDVARQ AGVSVATVSR VLNNSTLVSA DTREAVMKAV SELDYRPNAN AQALATQVSD 
TIGVVVMDVS DAFFGALVKA VDLVAQQHQK YVLIGNSYHE AEKERHAIEV LIRQRCNALI 
VHSKALSDDE LAQFMDNIPG MVLINRVVPG YTHRCVCLDN LSGARMATRM LLNNGHQRIG 
YLSSSHGIED DAMRKAGWMS ALKEQDIIPP ESWIGTGTPD MPGGEAAMVE LLGRNLQLTA 
VFAYNDNMAA GALTALKDNG IAIPLHLSII GFDDIPIARY TDPQLTTVRY PIASMAKLAT 
ELALQGAAGN IDPRASHCFM PTLVRRHSVA TRQNAAAITN STNQAM