Gene SeHA_C3520 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3520
Symbol
ID	6491738
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3415858
End bp	3417102
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	56%
IMG OID	642743648
Product	serine/threonine transporter SstT
Protein accession	YP_002047262
Protein GI	194448355
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3633] Na+/serine symporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.234928
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	51
Fosmid unclonability p-value	0.00469986
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTACGC AACGAGCATC AGGGCTACTG CAGCGTTTAG CGCAAGGCAG TCTGGTTAAA 
CAAATTTTAG TGGGTCTGGT ACTGGGGATT TTACTGGCAT GGATTTCTAA GCCTGCGGCA 
GAAGCGGTTG GCTTGCTTGG CACCCTGTTC GTCGGCGCCT TAAAAGCGGT CGCCCCCGTT 
CTGGTGCTGA TGCTGGTAAT GGCCTCGATC GCCAACCACC AGCACGGCCA AAAAACCAAT 
ATTCGCCCTA TTCTCTTTCT TTACCTGCTA GGCACCTTTT CAGCCGCGCT GGCGGCCGTT 
GTGTTCAGCT TCGCCTTCCC TTCAACCCTG CATTTGTCCA GTAGCGCCCA GGATATCGTG 
CCGCCGTCCG GCATTGTAGA AGTCCTGCGC GGTCTGCTGA TGAGCATGGT GTCGAACCCC 
ATCGACGCGC TGCTGAACGC TAACTATATC GGGATTCTGG TATGGGCCGT CGGTCTGGGA 
TTTGCCCTGC GTCATGGCAA TGAAACCACC AAAAACCTCG TGAACGATAT GTCTAACGCC 
GTGACCTTTA TGGTGAAACT GGTGATCCGT TTCGCGCCAG TCGGTATTTT TGGTCTGGTT 
TCATCAACGC TTGCAACCAC CGGCTTCTCT ACCCTGTGGG GTTATGCGCA CCTGCTGGTC 
GTCTTGATTG GCTGTATGCT GCTGGTCGCG CTGATGGTCA ACCCGCTGTT GGTATTCTGG 
AAAATTCGTC GCAACCCTTA TCCGCTGGTG TTCGCCTGCC TGCGTGAAAG CGGCGTTTAT 
GCCTTCTTTA CCCGCAGCTC TGCCGCCAAT ATTCCAGTGA ATATGGCGCT GTGCGAAAAG 
CTGAATCTGG ACAGGGATAC TTACTCCGTT TCCATTCCGC TGGGCGCCAC TATCAATATG 
GCCGGCGCGG CAATTACCAT TACGGTTCTG ACGTTGGCGG CAGTCCATAC GTTAGGCGTC 
CCGGTGGATC TGCCTACAGC GCTGCTGCTG AGCGTGGTGG CCTCGCTGTG TGCTTGCGGC 
GCCTCCGGCG TGGCAGGCGG TTCATTGCTG CTGATCCCGC TGGCGTGCAA CATGTTTGGC 
ATCCCGAACG ATATCGCGAT GCAGGTAGTA GCGGTCGGCT TTATTATCGG CGTATTGCAG 
GATTCGTGTG AAACGGCGCT GAACTCGTCT ACCGATGTTC TGTTCACTGC GGCAGCCTGC 
CAGGCAGAGG ACGAACGTCT GGCGAATAAC GCCTTGCGTA GCTAA

Protein sequence

MATQRASGLL QRLAQGSLVK QILVGLVLGI LLAWISKPAA EAVGLLGTLF VGALKAVAPV 
LVLMLVMASI ANHQHGQKTN IRPILFLYLL GTFSAALAAV VFSFAFPSTL HLSSSAQDIV 
PPSGIVEVLR GLLMSMVSNP IDALLNANYI GILVWAVGLG FALRHGNETT KNLVNDMSNA 
VTFMVKLVIR FAPVGIFGLV SSTLATTGFS TLWGYAHLLV VLIGCMLLVA LMVNPLLVFW 
KIRRNPYPLV FACLRESGVY AFFTRSSAAN IPVNMALCEK LNLDRDTYSV SIPLGATINM 
AGAAITITVL TLAAVHTLGV PVDLPTALLL SVVASLCACG ASGVAGGSLL LIPLACNMFG 
IPNDIAMQVV AVGFIIGVLQ DSCETALNSS TDVLFTAAAC QAEDERLANN ALRS