Gene SNSL254_A4443 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4443
Symbol
ID	6485303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	4318928
End bp	4320007
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	57%
IMG OID	642739682
Product	putative fructose-like permease EIIC subunit 2
Protein accession	YP_002043376
Protein GI	194442482
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1299] Phosphotransferase system, fructose-specific IIC component
TIGRFAM ID	[TIGR01427] PTS system, fructose subfamily, IIC component

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	0.35226
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGAGT TGGTACAGAT CCTGAAAAAT ACCCGCCAGC ACCTGATGAC CGGTGTTTCG 
CATATGATCC CCTTTGTGGT GGCTGGCGGA ATTTTGCTGG CAGTCTCCGT CATGCTATAT 
GGCAAGGGCG CCGTACCCGA TGCCGCCACC GATCCGAATC TTAAAAAACT GTTTGATATC 
GGTGTCGCCG GGCTGACGCT GATGGTGCCT TTCCTCGCCG CATACATCGG CTACTCCATT 
GCCGAACGCT CCGCGCTGGC TCCTTGCGCG ATTGGTGCCT GGGTGGGTAA CAGCTTCGGC 
GCGGGCTTTT TCGGGGCACT TATCGCCGGA CTTATCGGCG GGATCGTGGT GCATTACTTG 
AAGAAAATCC CGGTGCATAA GGTGCTGCGT TCTGTGATGC CTATTTTTGT GATTCCCATC 
GTTGGCACTT TTATCACCGC GGGCATCATG ATGTGGGGGC TGGGCGAACC GATCGGTGCG 
CTGACAAGCA GCCTGACCCA ATGGCTGCAA GGGATGCAGC AGGGCAGCAT CGTGCTGCTG 
GCGGTGATCA TGGGGCTGAT GCTGGCTTTT GATATGGGCG GCCCGGTTAA CAAAGTCGCT 
TATGCGTTCA TGCTGATTTG CGTGGCGCAG GGCGTATATA CCGTGGTGGC TATCGCCGCG 
GTGAGCATCT GCGTACCGCC GCTGGGACTG GGGCTGGCGA CGCTGATTGG CCGCAAGAAT 
TTTTCTGTTG AAGAGCGCGA AGCCGGTAAA GCCGCGCTGG TCATGGGCTG CGTGGGCGTA 
ACGGAAGGGG CGATTCCTTT CGCCGCTGCC GATCCGCTGC GCGTGATCCC ATCCATTATG 
GTGGGCTCCG CTTGCGGTGC GGTAATGGCC GCGCTGTTTG GCGCGCAGTG TTATGCCGGT 
TGGGGCGGTT TAATTGTTCT GCCAGTCGTG GAAGGCAAGC TGGGTTATGT CGCGGCAGTC 
GCCGTGGGCG CGGTGGTAAC GGCAGTCTGC GTTAACGTGC TGAAAAGCCT GACGCGTAAG 
AATGTGTCGC AAGTTGACGA AAAAGAAGAC GACCTGGATT TAGATTTTGA GATGAATTAA

Protein sequence

MKELVQILKN TRQHLMTGVS HMIPFVVAGG ILLAVSVMLY GKGAVPDAAT DPNLKKLFDI 
GVAGLTLMVP FLAAYIGYSI AERSALAPCA IGAWVGNSFG AGFFGALIAG LIGGIVVHYL 
KKIPVHKVLR SVMPIFVIPI VGTFITAGIM MWGLGEPIGA LTSSLTQWLQ GMQQGSIVLL 
AVIMGLMLAF DMGGPVNKVA YAFMLICVAQ GVYTVVAIAA VSICVPPLGL GLATLIGRKN 
FSVEEREAGK AALVMGCVGV TEGAIPFAAA DPLRVIPSIM VGSACGAVMA ALFGAQCYAG 
WGGLIVLPVV EGKLGYVAAV AVGAVVTAVC VNVLKSLTRK NVSQVDEKED DLDLDFEMN