Gene SeHA_C3019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3019
Symbol
ID	6491977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	2953378
End bp	2954349
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	59%
IMG OID	642743174
Product	glucitol/sorbitol-specific phosphotransferase enzyme iib component
Protein accession	YP_002046793
Protein GI	194448972
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3732] Phosphotransferase system sorbitol-specific component IIBC
TIGRFAM ID	[TIGR00825] PTS system, glucitol/sorbitol-specific, IIBC component

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.824211
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.00000475324
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACACGGG TTCGTATTGA GAAAGGCGCC GGCGGCTGGG GCGGCCCGCT TGAACTGGAC 
GTTACGCCAG GCAAAAAGAT CGTCTATATC ACAGCCGGTA CGCGCCCGGC GATCGTCGAC 
AAACTGGCGC AACTAACAGG CTGGCAAGCG GTGGACGGCT TTAAAGAAGG CGAACCGCCG 
GAAGCGGAAA TCGGCGCGGC CATTATCGAC TGCGGCGGTA CGCTGCGCTG CGGTATCTAT 
CCGAAACGCC GGATTCCAAC CATTAATATT CACTCGACGG GTAAGTCCGG CCCCCTGGCG 
CAGTATATTG TTGAGGATAT TTATGTCTCC GGCGTAAAAG AAGAAAACAT TACTCTTGTC 
GGCGAAACGC CTGCCAGTCC CCAGCCTGCC AAAACGACAT TAGGGCGTGA CTACGACACC 
AGCAAAAAAA TCACCGAGCA GAGCGACGGG CTGCTGGCAA AAGTCGGTAT GGGAATGGGC 
TCCGCCGTGG CGGTACTGTT CCAGTCCGGT CGCGACACCA TTGATACGGT CCTGAAAACA 
ATCCTGCCGT TTATGGCGTT CGTTTCGGCG CTGATCGGCA TCATTATGGC CTCAGGTCTT 
GGCGACTGGA TCGCCCACGG CCTGGCGCCA TTAGCCAGCC ATCCACTGGG GCTGGTGACG 
CTGGCATTGA TCTGCTCTTT CCCGCTGCTG TCGCCCTTTC TCGGCCCTGG CGCGGTTATC 
GCTCAGGTCA TTGGCGTCCT GATCGGCGTT CAGATAGGCC TGGGCAATAT CCCCCCGCAT 
CTGGCGCTTC CCGCCCTGTT CGCGATTAAC GCGCAGGCGG CCTGCGACTT TATCCCGGTC 
GGCCTGTCGC TGGCGGAAGC GAAACAAGAC ACCGTTCGCG TCGGAGTACC TTCTGTGCTG 
GTCGGACGCT TCCTGACTGG CGCGCCCACG GTACTTATCG CCTGGTTTGT TTCCGGCTTT 
ATCTATCAAT AA

Protein sequence

MTRVRIEKGA GGWGGPLELD VTPGKKIVYI TAGTRPAIVD KLAQLTGWQA VDGFKEGEPP 
EAEIGAAIID CGGTLRCGIY PKRRIPTINI HSTGKSGPLA QYIVEDIYVS GVKEENITLV 
GETPASPQPA KTTLGRDYDT SKKITEQSDG LLAKVGMGMG SAVAVLFQSG RDTIDTVLKT 
ILPFMAFVSA LIGIIMASGL GDWIAHGLAP LASHPLGLVT LALICSFPLL SPFLGPGAVI 
AQVIGVLIGV QIGLGNIPPH LALPALFAIN AQAACDFIPV GLSLAEAKQD TVRVGVPSVL 
VGRFLTGAPT VLIAWFVSGF IYQ