Gene SNSL254_A3035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3035
Symbol
ID	6484938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2955368
End bp	2956339
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	58%
IMG OID	642738350
Product	glucitol/sorbitol-specific phosphotransferase enzyme iib component
Protein accession	YP_002042074
Protein GI	194445373
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3732] Phosphotransferase system sorbitol-specific component IIBC
TIGRFAM ID	[TIGR00825] PTS system, glucitol/sorbitol-specific, IIBC component

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.673826
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.00564153
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACACGGG TTCGTATTGA GAAAGGCGCC GGCGGCTGGG GCGGCCCGCT TGAACTGGAC 
GTTACGCCAG GCAAAAAGAT CGTCTATATC ACAGCCGGTA CGCGCCCGGC GATCGTCGAC 
AAACTGGCGC AACTAACAGG CTGGCAAGCG GTGGACGGCT TTAAAGAAGG CGAACCGCCG 
GAAGCGGAAA TCGGCGCGGC CATTATCGAC TGCGGCGGTA CGCTGCGCTG CGGTATCTAT 
CCGAAACGCC GGATTCCAAC CATTAATATT CACTCGACGG GTAAGTCCGG CCCACTGGCG 
CAGTATATTG TTGAGGATAT TTATGTCTCC GGCGTAAAAG AAGAAAACAT TACTCTTGTC 
GGCGAAACAC CTGCCAGTCC TCAGCCTGCC AAAACGACAT TAGGACGTGA CTACGACACC 
AGCAAAAAAA TCACCGAGCA GAGCGACGGG CTGCTGGCAA AAGTCGGTAT GGGAATGGGC 
TCCGCCGTGG CGGTACTGTT CCAGTCCGGT CGCGACACCA TTGATACGGT CCTGAAAACA 
ATCCTGCCGT TTATGGCGTT CGTTTCGGCG CTGATCGGCA TCATTATGGC CTCAGGTCTT 
GGCGACTGGA TCGCCCACGG CCTGGCGCCA TTAGCCAGCC ATCCACTGGG GCTGGTGACG 
CTGGCATTGA TCTGCTCGTT CCCGCTGCTG TCGCCCTTTC TCGGCCCTGG CGCGGTTATC 
GCTCAGGTCA TTGGCGTCCT GATCGGCGTT CAGATAGGCC TGGGCAATAT CCCCCCGCAT 
CTGGCGCTTC CCGCCCTGTT CGCGATTAAC GCGCAGGCGG CCTGCGACTT TATCCCGGTC 
GGCCTGTCGC TGGCGGAAGC GAAACAAGAC ACCGTTCGCG TCGGCGTACC TTCTGTGCTG 
GTCGGACGCT TCCTGACTGG CGCGCCCACG GTACTTATCG CCTGGTTTGT TTCCGGCTTT 
ATCTATCAAT AA

Protein sequence

MTRVRIEKGA GGWGGPLELD VTPGKKIVYI TAGTRPAIVD KLAQLTGWQA VDGFKEGEPP 
EAEIGAAIID CGGTLRCGIY PKRRIPTINI HSTGKSGPLA QYIVEDIYVS GVKEENITLV 
GETPASPQPA KTTLGRDYDT SKKITEQSDG LLAKVGMGMG SAVAVLFQSG RDTIDTVLKT 
ILPFMAFVSA LIGIIMASGL GDWIAHGLAP LASHPLGLVT LALICSFPLL SPFLGPGAVI 
AQVIGVLIGV QIGLGNIPPH LALPALFAIN AQAACDFIPV GLSLAEAKQD TVRVGVPSVL 
VGRFLTGAPT VLIAWFVSGF IYQ