Gene SeD_A4837 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4837
Symbol	treR
ID	6875487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4690803
End bp	4691750
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	56%
IMG OID	642787725
Product	trehalose repressor
Protein accession	YP_002218319
Protein GI	198242111
COG category	[K] Transcription
COG ID	[COG1609] Transcriptional regulators
TIGRFAM ID	[TIGR02405] trehalose operon repressor, proteobacterial

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAAACC GGCTCACTAT CAAAGACATC GCCCGCCTGA GCGGCGTAGG GAAATCAACC 
GTTTCCCGCG TGCTTAACAA TGAAAGCGGC GTAAGCGAAC GTACCCGCGA GCGTGTCGAA 
GCGGTGATGA ATCAACACGG TTTCTCCCCG TCCCGCTCTG CCCGCGCGAT GCGGGGACAA 
AGCGATAAAG TGGTCGCTAT TATCGTCACT CGCCTTGATT CGTTGTCTGA AAACCTCGCG 
GTTCAGACCA TGCTGCCTGC GTTTTATGAA CAGGGCTACG ACCCTATTAT GATGGAAAGT 
CAGTTCTCGC CGACGCTGGT AATGGAACAT CTGGGCATGC TCAGACGACG TAACATTGAT 
GGCGTGGTGC TGTTTGGCTT TACCGGCATC ACAGAAGAGT TGATCGCCCC CTGGAAAGCC 
TCGCTGGTGC TGCTGGCAAG AGATGCGCAA GGTTTTGCCT CCGTCTGTTA CGACGACGAG 
GGCGCGATTC ATATCCTTAT GCAGCGGCTG TATGAGCAGG GACACCGCAA CATTAGCTTT 
CTGGGCGTTC CCCATAGCGA TATTACCACC GGCAAACGTC GGCATGACGC ATACCTGGCG 
TTTTGCAAAA AACATAAACT TCATCCCGTC GCCGCCCTGC CCGGTCTTGC CATGAAGCAG 
GGCTATGAGC ATACGGCAAG CGTCATCATG CCGGATACCA CCGCGTTAGT CTGCGCCACC 
GATACGCTGG CGTTGGGCGC CAGTAAGTAT TTACAGGAGC AACGTATTGA GACGCTGCAA 
CTGGCAAGCG TCGGGAACAC GCCGCTGATA AAATTCCTGC ACCCGGAGAT CGTCACTGTC 
GATCCTGGCT ATGCTGAAGC CGGACGACAG GCGGCTTCGC AGCTGATCGA ACAGATCAAT 
GGCCGCTGCG ATCCGCGCCG GATCGTCATT CCTTCTACCC TCGCCTGA

Protein sequence

MQNRLTIKDI ARLSGVGKST VSRVLNNESG VSERTRERVE AVMNQHGFSP SRSARAMRGQ 
SDKVVAIIVT RLDSLSENLA VQTMLPAFYE QGYDPIMMES QFSPTLVMEH LGMLRRRNID 
GVVLFGFTGI TEELIAPWKA SLVLLARDAQ GFASVCYDDE GAIHILMQRL YEQGHRNISF 
LGVPHSDITT GKRRHDAYLA FCKKHKLHPV AALPGLAMKQ GYEHTASVIM PDTTALVCAT 
DTLALGASKY LQEQRIETLQ LASVGNTPLI KFLHPEIVTV DPGYAEAGRQ AASQLIEQIN 
GRCDPRRIVI PSTLA