Gene SNSL254_A1657 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1657
Symbol
ID	6483557
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	1620855
End bp	1622096
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	49%
IMG OID	642737042
Product	major facilitator superfamily MFS_1
Protein accession	YP_002040794
Protein GI	194444944
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.992815
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATACTA ATGTCTATGA GAACACCGAC AGCGAAACTA TCACCCCGCT CAACAAGCGG 
CGTATTTTGC CTGTTTTCCT GCTTGTCGGC CTTTACGCCG CCAGTACAGC GGCTGTAATG 
TCGGTACTGC CTTTTTATAT CCGCGAGATG GGCGGTTCGC CGCTTATCAT TGGAATCATC 
ATCGCCACTG AAGCTTTTAG CCAATTTTGT GCGGCGCCCC TGATTGGCCA CCTTTCCGAT 
CGCGTTGGCC GCAAGCGAAT ATTGATTGTC ACGCTGGCTA TTGCGGCGAT AAGTTTACTA 
TTACTCGCCA ACGCGCAATG TATCCTGTTT ATCCTGCTCG CCCGCACGCT TTTTGGCATT 
AGCGCCGGGA ATTTGTCAGC CGCCGCAGCC TATATTGCCG ATTGTACGCA CGTCAGAAAT 
CGGCGTCAGG CAATCGGTAT CCTCACAGGC TGCATTGGTT TAGGCGGTAT TGTCGGGGCA 
GGCGTTTCCG GGTGGTTATC GCGTATCAGT CTGAGCGCGC CGATCTACGC CGCCTTTATA 
CTTGTCCTTG GGTCTGCCCT GGTCGCGATT TGGGGGTTAA AAGACCCTTC CACAACATCA 
CGTACCACAG ATAAAATAGC GGCGTTCTCT GCCCGCGCTA TTTTAAAGAT GCCTGTCCTT 
CGCGTCTTAA TCATCGTAAT GCTTTGTCAT TTCTTCGCCT ATGGCATGTA CTCTTCACAA 
TTACCTGTTT TTCTTTCTGA CACCTTCATC TGGAATGGGC TTCCCTTTGG GCCAAAAGCG 
TTAAGCTATC TGTTAATGGC GGACGGGGTT ATTAATATTT TCGTTCAGCT ATTTCTGTTA 
GGTTGGGTGA GCCAATATTT TTCGGAGCGA AAGCTAATTA TCCTCATCTT CGCCCTTCTT 
TGTACTGGAT TTCTCACTGC GGGTATCGCC ACGACCATAC CTGTGCTTGT TTTTGCTATC 
GTTTGTATTA GCATCGCTGA TGCGCTAGCC AAACCCACTT ATCTTGCCGC CTTGTCCGTC 
CATGTATCGC CTGCCCGACA AGGTATCGTC ATCGGAACGG CGCAGGCATT AATCGCAATC 
GCTGATTTTA TATCCCCCGT ATTGGGCGGA TTTGTCCTGG GTTATGCTCT GTATGGCGTC 
TGGATCGGTA TAGCTATCTC TGTCGCCATT ATTGGTCTGG TGACGGCAAT GATTTACCTT 
TCAAAAAGTT CACCGCTAAT AGTGAAACCA GAAACAGAAT AA

Protein sequence

MNTNVYENTD SETITPLNKR RILPVFLLVG LYAASTAAVM SVLPFYIREM GGSPLIIGII 
IATEAFSQFC AAPLIGHLSD RVGRKRILIV TLAIAAISLL LLANAQCILF ILLARTLFGI 
SAGNLSAAAA YIADCTHVRN RRQAIGILTG CIGLGGIVGA GVSGWLSRIS LSAPIYAAFI 
LVLGSALVAI WGLKDPSTTS RTTDKIAAFS ARAILKMPVL RVLIIVMLCH FFAYGMYSSQ 
LPVFLSDTFI WNGLPFGPKA LSYLLMADGV INIFVQLFLL GWVSQYFSER KLIILIFALL 
CTGFLTAGIA TTIPVLVFAI VCISIADALA KPTYLAALSV HVSPARQGIV IGTAQALIAI 
ADFISPVLGG FVLGYALYGV WIGIAISVAI IGLVTAMIYL SKSSPLIVKP ETE