Gene EcE24377A_2446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2446
Symbol	galS
ID	5586644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	2428967
End bp	2430007
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	52%
IMG OID	640926107
Product	DNA-binding transcriptional regulator GalS
Protein accession	YP_001463502
Protein GI	157156713
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCACCA TTCGTGATGT AGCGCGTCAG GCTGGCGTCT CTGTGGCAAC GGTTTCCCGG 
GTGCTCAATA ACAGCACGCT GGTCAGTGCC GACACGCGTG AAGCAGTAAT GAAAGCCGTG 
AGTGAGCTGG ATTATCGGCC AAATGCCAAT GCCCAGGCGC TGGCAACTCA GGTTAGCGAT 
ACCATTGGCG TGGTGGTGAT GGACGTTTCT GATGCTTTTT TCGGCGCGCT GGTAAAAGCG 
GTGGATCTGG TCGCCCAGCA GCATCAGAAA TACGTGCTAA TCGGCAATAG CTATCATGAA 
GCGGAAAAAG AGCGTCACGC CATTGAGGTG TTAATTCGCC AGCGTTGTAA TGCGTTGATT 
GTTCACTCAA AAGCATTGAG TGACGATGAA CTGGCGCAAT TTATGGATAA CATTCCCGGT 
ATGGTGTTAA TCAACCGCGT TGTGCCGGGG TACGCCCATC GTTGCGTTTG CCTGGATAAT 
CTCAGCGGTG CCCGAATGGC GACGCGCATG TTGCTGAATA ACTGTCATCA ACGTATTGGT 
TATCTTTCTT CCAGCCACGG CATTGAAGAT GACGCCATGC GTAAAGCAGG CTGGATGAGT 
GCGTTGAAAG AGCAGGATAT TATTCCGCCG GAAAGCTGGA TTGGCACTGG TACGCCGGAC 
ATGCCGGGCG GTGAGGCGGC GATGGTTGAA CTGCTGGGGC GCAATCTACA ACTTACCGCT 
GTATTTGCTT ATAACGACAA TATGGCCGCT GGCGCACTGA CAGCATTAAA AGATAATGGC 
ATTGCGATTC CGTTACATCT CTCAATCATC GGTTTCGATG ATATTCCCAT CGCCCGTTAC 
ACCGACCCGC AATTAACGAC CGTGCGTTAT CCCATTGCTT CAATGGCGAA ATTAGCCACC 
GAACTGGCCT TGCAGGGGGC AGCAGGCAAT ATTGATCCTC GTGCCAGCCA CTGTTTTATG 
CCGACGTTAG TGCGTCGCCA TTCTGTCGCA ACACGCCAGA ATGCGGCGAC GATCACTAAC 
TCAACAAATC AGGCGATGTA A

Protein sequence

MITIRDVARQ AGVSVATVSR VLNNSTLVSA DTREAVMKAV SELDYRPNAN AQALATQVSD 
TIGVVVMDVS DAFFGALVKA VDLVAQQHQK YVLIGNSYHE AEKERHAIEV LIRQRCNALI 
VHSKALSDDE LAQFMDNIPG MVLINRVVPG YAHRCVCLDN LSGARMATRM LLNNCHQRIG 
YLSSSHGIED DAMRKAGWMS ALKEQDIIPP ESWIGTGTPD MPGGEAAMVE LLGRNLQLTA 
VFAYNDNMAA GALTALKDNG IAIPLHLSII GFDDIPIARY TDPQLTTVRY PIASMAKLAT 
ELALQGAAGN IDPRASHCFM PTLVRRHSVA TRQNAATITN STNQAM