Gene SNSL254_A4801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4801
Symbol	treB
ID	6482257
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	4675885
End bp	4677303
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	56%
IMG OID	642740015
Product	PTS system trehalose(maltose)-specific transporter subunits IIBC
Protein accession	YP_002043693
Protein GI	194444469
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR00852] PTS system, maltose and glucose-specific subfamily, IIC component [TIGR01992] PTS system, trehalose-specific IIBC component

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.318828
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	93
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAAG TAAAACAAGC CGATATCGAC CGGCTGATTG ACCTGGTCGG CGGGCGTGAC 
AACATCGCCA CGGTGAGCCA CTGCATTACT CGCCTGCGCT TTGTGCTCCA CCAGCCCACG 
AACGCCCGAC CAAAAGAGAT CGAACAATTG CCGATGGTTA AAGGCTGTTT CACCAACGCC 
GGGCAGTTTC AGGTGGTGAT CGGCACCGAA GTCGGCGATT ACTATAACGC GCTGCTGGAG 
ACCACCGGCA AAGCATATGC CGATAAAGAG CAGGCCAAAA AAGCCGCTCG CCAGAACATG 
AAGTGGCATG AGCAGTTAAT TTCCCACTTT GCGGAGATCT TCTTTCCGCT ACTACCGGCG 
TTGATCAGCG GCGGTTTGAT CTTAGGCTTT CGTAACGTGA TCGGCGATGT GCCGATGAGC 
AACGGCCAAA CGCTGGCGCA GATGCATCCG GCGCTAAAAA CGCTTTATGA TTTTTTATGG 
TTAATCGGCG AAGCGATCTT TTTCTATCTG CCGGTGGGGA TCTGCTGGTC GGCGGTGAAA 
AAAATGGGCG GCACGCCGAT TCTTGGTATC GTGCTCGGCG TGACGCTGGT GTCGCCGCAG 
TTGATGAATG CGTATCTGCT GGGCCAGCAA ACGCCGGACG TCTGGAACTT CGGCTTATTT 
AGCATTGAGA AAGTGGGCTA CCAGGCGCAG GTTATCCCGG CGTTATTGGC AGGGCTGGCG 
CTTGGGTTTA TTGAAACGCA GTTGAAACGC ATCGTGCCGG ATTATCTCTA CCTGGTCGTC 
GTCCCGGTGT GTTCGTTAAT ACTGGCCGTC TTTCTCGCCC ACGCCTTTAT CGGCCCCTTT 
GGTCGTATGA TCGGCGACGG CGTGGCCTTT GCGGTACGTT ATCTGATGAC CGGCAGTTTC 
GCCCCGATAG GCGCAGCGCT GTTCGGCTTC CTGTATGCCC CGTTGGTCAT TACCGGCGTC 
CACCAGACAA CGCTCGCTAT CGATATGCAG ATGATCCAGA GCATGGGCGG TACGCCAGTC 
TGGCCGCTGA TTGCGCTGTC GAATATCGCG CAGGCCTCCG CCGTGGTGGG CATCATCATC 
TCCAGCCGTA AACACAATGA ACGCGAGATC TCCGTTCCTG CCGCCATTTC CGCTTACCTT 
GGGGTAACTG AACCGGCGAT GTACGGTATC AACCTGAAGT ATCGTTTTCC GATGCTGTGC 
GCGATGATCG GATCTGGTCT GGCGGGACTG CTCTGCGGTC TGAACGGCGT CATCGCCAAC 
GGTATCGGCG TGGGCGGCCT GCCGGGCATC CTGTCTATAC CGCCGCGCTA CTGGCAGGTG 
TACGGCATGG CGATGGTTAT CGCGATCGTG ATCCCGGTGA TTCTGACCAC CTTTATCTAT 
CAGCGTAAGC ATCGTCAGGG CACATTACAA ATTGTCTAA

Protein sequence

MSKVKQADID RLIDLVGGRD NIATVSHCIT RLRFVLHQPT NARPKEIEQL PMVKGCFTNA 
GQFQVVIGTE VGDYYNALLE TTGKAYADKE QAKKAARQNM KWHEQLISHF AEIFFPLLPA 
LISGGLILGF RNVIGDVPMS NGQTLAQMHP ALKTLYDFLW LIGEAIFFYL PVGICWSAVK 
KMGGTPILGI VLGVTLVSPQ LMNAYLLGQQ TPDVWNFGLF SIEKVGYQAQ VIPALLAGLA 
LGFIETQLKR IVPDYLYLVV VPVCSLILAV FLAHAFIGPF GRMIGDGVAF AVRYLMTGSF 
APIGAALFGF LYAPLVITGV HQTTLAIDMQ MIQSMGGTPV WPLIALSNIA QASAVVGIII 
SSRKHNEREI SVPAAISAYL GVTEPAMYGI NLKYRFPMLC AMIGSGLAGL LCGLNGVIAN 
GIGVGGLPGI LSIPPRYWQV YGMAMVIAIV IPVILTTFIY QRKHRQGTLQ IV