Gene SNSL254_A4117 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4117
Symbol
ID	6485116
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	4005939
End bp	4007201
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	47%
IMG OID	642739373
Product	putative permease
Protein accession	YP_002043082
Protein GI	194445607
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.477286
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	87
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGATGG CCCTTACCGC CCCCCCAACC AGGAAAAGAT TTTTAATCGT TGCCTGTCTG 
TTTATTGGAA TATTTATTGC TTATCTCGAT CGCGTTAATG TTTCGGTATT AGCCGCGAAT 
GAACCCTTCT TAGCCTATAT GGGTATTGAA GGTATGCCAT TGCAAATCGG CATGATGATG 
ACCGTCTTTC TGGCCGCTTA TGGTATCGCT AACGTTGTAT TATCACCGCT TGGTGATTAT 
CTCGGCCCCA GAAAAGCAAT GATGCTTTGT ATTCTGATCT GGACTATCGC TTTAATGATT 
GGCGGAGTCG CTACATCATT CGCTCTAATT ATTATTTGCC GTATATTACT GGGCATCGGA 
GAGGGATTTT ATTATCCACT GCAAAGCGTA TTTATTAAAA ACTGGTTCCC GAAGCAGGAG 
CGCGGCAGAG CAAACGCGGC GTGGATCGTC GGCCAGTCGG TGGCACCCGC CATTGCGATG 
CCTTTTTTCA CCTGGTGGAT AGGCACCCAC GGCTGGCGTT CCAACTTTTT CTTATGCGCC 
GCTCTCGGGT TAATCCCTCT TTGGCTACTT TGGCGATATG TTGCTGATAA ACCAGAACAA 
CATAAAAGTA TCAGCGAACA AGAACTGGCT TATATCAAAG CTGGACAGGA AACGGAAAGC 
GCAGGCAACA GCGAAAGTTT TATGTTGCGG GTAAAACCGG TGATCACCAA CTACTGTTAC 
TGGCTGCTGG TACTGTGGTA TCTGTGTCTG CAATGCCTGT ACTGGGGGAT GATTACCTGG 
CTGCCGACCT ATCTAAAATC AGCCAGAGGA TTCAGTTGGG CGGAAATGGG CTGGCTGGCG 
TCGCTTCCCT TTGTCCTGTC GATATTTGCC AAAGCGGCCG CAGGCGTCTT CGTCGATAAA 
ATAGGACGCA GCGCCCCCAT ATTAATGGTA TTAATGTTTT TCGCTGGCGT CAGTATCTAT 
TTCGGCACCA TAACCGAACA TAAATATATG TCGGCGGTAC TCCTCTCCTT TGCTGTTGCT 
TTCTGTACGA TGGGTACGCC CGTTGCCTGG ACGTTATTAC AGGGAATGAT ACCCGGAAAA 
TCTATTTCTG CCGCCAGCGG CGTAATGAAC GGCGTCGCCA ATGGACTCTC TTCATTATCC 
CCCGTATTTA TCGGCTTATT TATTTCTATC ACTGGAACTT ATACCGGCGG CTTACTATGC 
CTGGTTTTTA TCAGCGCTAT CGCCGTGGTA TCGGCATTAA TCTTAACGAT TAAAAAATAT 
TAA

Protein sequence

MSMALTAPPT RKRFLIVACL FIGIFIAYLD RVNVSVLAAN EPFLAYMGIE GMPLQIGMMM 
TVFLAAYGIA NVVLSPLGDY LGPRKAMMLC ILIWTIALMI GGVATSFALI IICRILLGIG 
EGFYYPLQSV FIKNWFPKQE RGRANAAWIV GQSVAPAIAM PFFTWWIGTH GWRSNFFLCA 
ALGLIPLWLL WRYVADKPEQ HKSISEQELA YIKAGQETES AGNSESFMLR VKPVITNYCY 
WLLVLWYLCL QCLYWGMITW LPTYLKSARG FSWAEMGWLA SLPFVLSIFA KAAAGVFVDK 
IGRSAPILMV LMFFAGVSIY FGTITEHKYM SAVLLSFAVA FCTMGTPVAW TLLQGMIPGK 
SISAASGVMN GVANGLSSLS PVFIGLFISI TGTYTGGLLC LVFISAIAVV SALILTIKKY