Gene SNSL254_A1669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1669
Symbol
ID	6486315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1628465
End bp	1629472
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	54%
IMG OID	642737051
Product	HTH-type transcriptional regulator GalR
Protein accession	YP_002040803
Protein GI	194442719
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	71
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACAA TAAAGGATGT TGCATCCATG GCCGGTGTAT CAACCGCGAC TGTATCACGC 
GTCATTAACC AGACCGCGTG GGTTGAACCC GTCACGCGCG AACGTGTAGA GAAAGCCATG 
CGCGATCTCA ATTATCGCCG GAATGCCGCC GCTATCGCGC TGGCGAAACG TAGCGGCGAT 
ATGCTCGGAT TGTTAACCGG CAATCTGGCA GATCCTTTTT TTGCCCGCCT TGCTCGCGGC 
GTAGAAGATG TTTCTCGTAA GCAGCAGTAT CGCTTGATGG TATGTAGCGG CGGCCACGAC 
GAAGAAATGG AAAAAGCGGG ACTGGATTTT CTGGTTAATC AAGGTTGTGA GGCTATTGTT 
GTACACGCCA GCCGATTACC GGATAAAGAG CTGCTGCGCT ACGCAGCCCA CTTTCCAGCG 
CTGGTTGTTG TGAATCGTTA TATCGCCGGT ATGGCCAACC GGTGTATCTG GCTGGAAAAT 
CGCAGCGCCG CCAGGGAAGC GACCCGATAT CTCCTGGCGA ACGGGCATCG GCGCATCGCC 
TGTGTGACAT CTGACTTGCC AATTATCGAT CGTCAGGAAC GCCTTGATGG TTACCGTGAA 
GCGCTGGAAG AATATGGTAT TTCTCCAGAC CCTCGCTGGG TGATTAGCGT TCCGTTTAAC 
GAAGAAGGCG GCGAGCGGGC CGCGCATCAA CTTATTAATA GCGGGCTTCC CCTTACGGCA 
GCGGTCACGT TTAACGATGT GATGGCCGCT GGCATTATGC GTATTCTTCA TCAACGCGGC 
GTTCAGCTTC CGCAACAGCT CTCTATTGTC GGCTTTGATG ATGTGGTGCT GGCCCGGTAT 
CTTTATCCGG CGTTAACAAC AATGCATTAT CCGGTCGAAC AAATGGCGCG TTGTGCCGCG 
CAACTGGCGA TACAGTTATA CCAGGGCATT ACGCCGCCGC CCAGCAGCAA TCATTTCAAT 
GCCGAACTGG TGATCCGCGA TTCTGTCGCG CCCTATTTTT CACGGTGA

Protein sequence

MATIKDVASM AGVSTATVSR VINQTAWVEP VTRERVEKAM RDLNYRRNAA AIALAKRSGD 
MLGLLTGNLA DPFFARLARG VEDVSRKQQY RLMVCSGGHD EEMEKAGLDF LVNQGCEAIV 
VHASRLPDKE LLRYAAHFPA LVVVNRYIAG MANRCIWLEN RSAAREATRY LLANGHRRIA 
CVTSDLPIID RQERLDGYRE ALEEYGISPD PRWVISVPFN EEGGERAAHQ LINSGLPLTA 
AVTFNDVMAA GIMRILHQRG VQLPQQLSIV GFDDVVLARY LYPALTTMHY PVEQMARCAA 
QLAIQLYQGI TPPPSSNHFN AELVIRDSVA PYFSR