Gene SeD_A3342 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3342
Symbol
ID	6871025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3218371
End bp	3219399
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	56%
IMG OID	642786347
Product	DNA-binding transcriptional regulator GalR
Protein accession	YP_002216986
Protein GI	198242171
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	49
Fosmid unclonability p-value	0.0205886
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACCA TAAAAGATGT AGCCCGACTG GCCGGTGTTT CAGTCGCCAC CGTTTCTCGC 
GTTATTAACG ATTCGCCAAA AGCCAGCGAA GCGTCCCGGC TGGCGGTGAC CAGCGCAATG 
GAGTCCCTGA GCTATCACCC TAACGCCAAC GCGCGCGCGC TGGCACAGCA GGCAACGGAA 
ACCCTCGGTC TGGTGGTCGG CGACGTTTCC GATCCTTTTT TCGGCGCGAT GGTGAAAGCC 
GTTGAACAGG TGGCGTATCA CACCGGCAAT TTTTTACTGA TTGGCAACGG GTATCATAAC 
GAACAAAAAG AGCGTCAGGC TATTGAACAG TTGATTCGCC ATCGTTGCGC AGCGTTAGTG 
GTACACGCCA AAATGATTCC GGATGCGGAC CTGGCCTCAT TAATGAAGCA AATCCCCGGC 
ATGGTGCTGA TTAACCGCAT TTTACCGGGG TTAGAACACC GCTGTGTCGC GCTGGATGAC 
CGTTACGGGG CATGGCTGGC GACCCGACAT CTGATCCAGC AAGGTCATAC GCGTATTGGG 
TATATCTGTT CCAACCACAC CATCTCTGAT GCCGAAGATC GCCTGAGGGG CTATTACGAT 
GCGCTGGCGG AAAGCCATAT CCCGGCTAAC GATCGGCTGG TGACGTTCGG CGAACCGGAT 
GAAAGCGGCG GCGAGCAGGC GATGACTGAG TTATTAGGCC GCGGCAGACA TTTTACCGCG 
GTGGCCTGCT ATAACGACTC GATGGCGGCC GGCGCGATGG GAGTATTAAA TGATAATGGC 
GTGGGGGTGC CGGGCGAAGT ATCGCTCATC GGTTTTGATG ATGTACTGGT CTCACGCTAT 
GTGCGTCCCC GACTGACCAC CATTCGGTAT CCGATCGTCA CCATGGCGAC ACAGGCGGCG 
GAGCTGGCGT TAGCGTTGGC GGGGAAATGC CCTACGCCAG AAGTAACTCA TGTATTTAGT 
CCGACACTGG TACGCCGACA TTCGGTATCC ACGCCGACGG ATACCGGGCA CCTGTCGACA 
ACCGATTAA

Protein sequence

MATIKDVARL AGVSVATVSR VINDSPKASE ASRLAVTSAM ESLSYHPNAN ARALAQQATE 
TLGLVVGDVS DPFFGAMVKA VEQVAYHTGN FLLIGNGYHN EQKERQAIEQ LIRHRCAALV 
VHAKMIPDAD LASLMKQIPG MVLINRILPG LEHRCVALDD RYGAWLATRH LIQQGHTRIG 
YICSNHTISD AEDRLRGYYD ALAESHIPAN DRLVTFGEPD ESGGEQAMTE LLGRGRHFTA 
VACYNDSMAA GAMGVLNDNG VGVPGEVSLI GFDDVLVSRY VRPRLTTIRY PIVTMATQAA 
ELALALAGKC PTPEVTHVFS PTLVRRHSVS TPTDTGHLST TD