Gene SeD_A2540 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2540
Symbol	galS
ID	6874324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	2418638
End bp	2419660
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	56%
IMG OID	642785615
Product	DNA-binding transcriptional regulator GalS
Protein accession	YP_002216273
Protein GI	198244274
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.182428
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	54
Fosmid unclonability p-value	0.113132
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACCA TTCGTGATGT AGCGCGCCAG GCTGGCGTGT CTGTAGCGAC CGTTTCCCGC 
GTACTGAATA ACAGCGCGTT GGTTAGTCCC GACACCCGTG ACGCCGTTAT GCAGGCCGTC 
ACCCTGCTGG GATATCGGCC AAATGCGAAT GCGCAAGCGC TGGCCACTCA GGTGAGCGAC 
ACCATCGGCG TCGTGGTCAT GGATGTTTCC GATGCCTTTT TCGGCGCTCT GGTGAAAGCC 
GTAGATCTGG TCGCGCAGCA GCACCAGAAA TATGTTCTCA TTGGCAACAG TTATCATGAG 
GCGGAAAAAG AGCGCCATGC GATTGAAGTC TTGATCCGTC AGCGTTGTAA CGCATTGATT 
GTTCACTCAA AAGCCTTAAC CGATCGCGAG CTGAGCGACT TTATGGATCA GATCCCCGGT 
ATGGTGCTGA TTAACCGTAT CGTGCCGGGT TATGCGCATC GTTGTGTTTG TCTCGACAAT 
GTGAGCGGCG CCAGAATGGC GACCCGAATG TTGCTGAATA ATGGACATCA ACGCATCGGC 
TACCTGGCCT CCAGCCACCG TATTGAAGAT GACGCGATGC GCAGAGAAGG GTGGTTACAC 
GCGCTGCAAG AGCAGGGGAT TGCTGCGTCG GAGAGCTGGA TAGGCACCGG CACGCCGGAC 
ATGCAGGGCG GCGAGTCGGC AATGGTTGAG TTGCTGGGAC GCAATCTGCA ACTGACGGCG 
GTATTTGCCT ATAACGATAA CATGGCGGCG GGCGCGCTGA CGGCGTTAAA AGATAACGGC 
ATCGCCATTC CCTTGCATCT GTCTGTCATC GGTTTCGATG ATATCCCTAT TGCTCGTTAT 
ACCGATCCTC AGTTGACTAC CGTGCGCTAT CCTATTGCTT CTATGGCGAA AATCGCGACC 
GAACTGGCGT TACAGGGGGC CGCAGGCACG CTGGATATCA CGGCGACGCA CTGCTTCATG 
CCGACCCTGG TGCGGCGCCA TTCGGTGGCG TGGCGACAGA ATGCGGTACT GATCACTAAC 
TGA

Protein sequence

MITIRDVARQ AGVSVATVSR VLNNSALVSP DTRDAVMQAV TLLGYRPNAN AQALATQVSD 
TIGVVVMDVS DAFFGALVKA VDLVAQQHQK YVLIGNSYHE AEKERHAIEV LIRQRCNALI 
VHSKALTDRE LSDFMDQIPG MVLINRIVPG YAHRCVCLDN VSGARMATRM LLNNGHQRIG 
YLASSHRIED DAMRREGWLH ALQEQGIAAS ESWIGTGTPD MQGGESAMVE LLGRNLQLTA 
VFAYNDNMAA GALTALKDNG IAIPLHLSVI GFDDIPIARY TDPQLTTVRY PIASMAKIAT 
ELALQGAAGT LDITATHCFM PTLVRRHSVA WRQNAVLITN