Gene SeD_A4835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4835
Symbol	treB
ID	6875410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	4689247
End bp	4690665
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	56%
IMG OID	642787724
Product	PTS system trehalose(maltose)-specific transporter subunits IIBC
Protein accession	YP_002218318
Protein GI	198246006
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR00852] PTS system, maltose and glucose-specific subfamily, IIC component [TIGR01992] PTS system, trehalose-specific IIBC component

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAAG TAAAACAAGC CGATATCGAC CGGCTGATTG ACCTGGTCGG CGGGCGCGAC 
AACATCGCCA CGGTGAGCCA CTGCATTACT CGCCTGCGCT TTGTGCTCCA CCAGCCCGCG 
AACGCCAGGC CAAAAGAGCT CGAACAATTA CCGATGGTTA AAGGCTGTTT CACCAACGCC 
GGGCAGTTTC AGGTGGTGAT TGGCACCGAC GTTGGCGATT ACTATAACGC GCTGCTGGAG 
ACCACCGGCA AAGCGTATGC TGATAAAGAG CAGGCCAAAA AAGCCGCTCG CCAGAACATG 
AAGTGGCATG AGCAGTTAAT TTCCCACTTT GCGGAGATCT TCTTTCCGCT ACTACCGGCG 
TTGATCAGCG GCGGTTTGAT CTTAGGCTTT CGTAACGTGA TCGGCGATGT GCCGATGAGC 
AACGGCCAAA CGCTGGCGCA GATGCATCCG GCGCTAAAAA CGCTTTATGA TTTTTTATGG 
TTGATCGGCG AAGCGATCTT TTTCTATCTG CCGGTGGGGA TCTGCTGGTC GGCGGTGAAA 
AAAATGGGCG GCACGCCGAT TCTTGGTATC GTGCTCGGCG TGACGCTGGT GTCGCCGCAG 
TTGATGAATG CGTATCTGCT GGGCCAGCAA ACGCCGGACG TCTGGAACTT CGGCTTATTT 
AGCATTGAGA AAGTGGGCTA CCAGGCGCAG GTTATCCCGG CGCTACTGGC AGGGCTGGCG 
CTTGGATTTA TTGAAACGCG GTTGAAACGC ATCGTGCCGG ATTATCTCTA CCTGGTCGTC 
GTCCCGGTGT GTTCGTTAAT ACTGGCCGTC TTTCTCGCCC ACACCTTTAT CGGCCCCTTT 
GGTCGTATGA TCGGCGACGG CGTGGCCTTT GCGGTACGTT ATCTGATGAC CGGCAGTTTC 
GCCCCGATAG GCGCGGCGCT GTTCGGCTTC CTGTATGCCC CGCTGGTCAT TACCGGTGTC 
CACCAGACAA CGCTCGCTAT CGATATGCAG ATGATCCAGA GCATGGGCGG TACGCCAGTC 
TGGCCGCTGA TTGCGCTGTC GAATATCGCA CAGGCCTCTG CCGTGGTGGG CATCATCATC 
TCCAGCCGTA AACACAATGA ACGCGAGATC TCCGTTCCTG CCGCCATTTC CGCTTACCTT 
GGGGTAACTG AACCGGCGAT GTACGGTATC AACCTGAAGT ATCGTTTTCC GATGCTGTGC 
GCGATGATCG GCTCTGGTCT GGCGGGACTG CTCTGCGGTC TGAACGGCGT CATCGCCAAC 
GGTATCGGCG TGGGCGGCCT GCCGGGCATC CTGTCTATAC CGCCGCGCTA CTGGCAGGTG 
TACGGCATGG CGATGGTTAT CGCGATCGTG ATCCCGGTGA TTCTGACCAC CTTTATCTAT 
CAGCGTAAGC ATCGTCAGGG CACATTACAA ATTGTCTAA

Protein sequence

MSKVKQADID RLIDLVGGRD NIATVSHCIT RLRFVLHQPA NARPKELEQL PMVKGCFTNA 
GQFQVVIGTD VGDYYNALLE TTGKAYADKE QAKKAARQNM KWHEQLISHF AEIFFPLLPA 
LISGGLILGF RNVIGDVPMS NGQTLAQMHP ALKTLYDFLW LIGEAIFFYL PVGICWSAVK 
KMGGTPILGI VLGVTLVSPQ LMNAYLLGQQ TPDVWNFGLF SIEKVGYQAQ VIPALLAGLA 
LGFIETRLKR IVPDYLYLVV VPVCSLILAV FLAHTFIGPF GRMIGDGVAF AVRYLMTGSF 
APIGAALFGF LYAPLVITGV HQTTLAIDMQ MIQSMGGTPV WPLIALSNIA QASAVVGIII 
SSRKHNEREI SVPAAISAYL GVTEPAMYGI NLKYRFPMLC AMIGSGLAGL LCGLNGVIAN 
GIGVGGLPGI LSIPPRYWQV YGMAMVIAIV IPVILTTFIY QRKHRQGTLQ IV