Gene SNSL254_A4333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4333
Symbol
ID	6484788
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	4221215
End bp	4222249
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	53%
IMG OID	642739577
Product	rhamnose-proton symporter
Protein accession	YP_002043271
Protein GI	194446545
COG category
COG ID
TIGRFAM ID	[TIGR00776] RhaT L-rhamnose-proton symporter family protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.0224713
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAACG CGATTACGAT GGGTATTTTC TGGCATTTGA TAGGGGCGGC CAGTGCAGCC 
TGCTTCTATG CCCCGTTCAA GCAAGTGAAA CAGTGGTCAT GGGAAACCAT GTGGTCAGTG 
GGCGGCATCG TCTCATGGCT TATTCTGCCG TGGACAATTA GCGCTCTGTT ACTGCCTGAT 
TTCTGGGCCT ATTATGGGCA GTTTAACCTC TCCACCCTTT TACCGGTTTT TCTGTTCGGC 
GCCATGTGGG GCATCGGCAA TATTAATTAC GGTCTAACCA TGCGTTATCT CGGGATGTCG 
ATGGGTATCG GCATCGCTAT CGGCATTACG CTTATCGTCG GCACGCTGAT GACGCCTATC 
ATCAACGGTA ACTTCGATGT GTTAATCCAT ACCGAAGGGG GACGCATGAC GCTACTTGGC 
GTTTTTGTCG CGCTGATCGG CGTCGGGATT GTGACGCGCG CCGGACAGTT AAAAGAACGC 
AAAATGGGCA TTAAAGCGGA GGAGTTCAAT CTGAAGAAAG GGCTTCTGCT GGCAGTGATG 
TGCGGTATTT TCTCGGCGGG GATGTCTTTT GCCATGAACG CCGCGAAACC GATGCATGAA 
GCTGCTGCCG CGCTTGGCGT TGACCCGCTC TATGTCGCGC TGCCGAGTTA CGTGGTGATT 
ATGGGCGGCG GCGCGCTGGT GAACCTCGGT TTCTGTTTTA TCCGCCTGGC AAAAGTGCAA 
AATCTGTCGA TAAAAGCCGA CTTCTCGCTG GCAAGACCGT TGATTATCAG CAATATTCTG 
TTGTCCGCGC TTGGCGGTCT GATGTGGTAT TTACAGTTCT TTTTCTATGC CTGGGGTCAC 
GCGCGCATTC CCGCGCAATA TGACTACATG AGCTGGATGC TGCACATGAG CTTCTATGTG 
CTGTGCGGGG GGCTTGTCGG TCTGGTGCTA AAAGAGTGGA AAAATGCTGG CCGCCGTCCC 
GTTGCCGTAT TAAGCCTCGG CTGCGTGGTA ATTATTATCG CGGCGAATAT TGTCGGTTTA 
GGCATGGCCA GTTAA

Protein sequence

MSNAITMGIF WHLIGAASAA CFYAPFKQVK QWSWETMWSV GGIVSWLILP WTISALLLPD 
FWAYYGQFNL STLLPVFLFG AMWGIGNINY GLTMRYLGMS MGIGIAIGIT LIVGTLMTPI 
INGNFDVLIH TEGGRMTLLG VFVALIGVGI VTRAGQLKER KMGIKAEEFN LKKGLLLAVM 
CGIFSAGMSF AMNAAKPMHE AAAALGVDPL YVALPSYVVI MGGGALVNLG FCFIRLAKVQ 
NLSIKADFSL ARPLIISNIL LSALGGLMWY LQFFFYAWGH ARIPAQYDYM SWMLHMSFYV 
LCGGLVGLVL KEWKNAGRRP VAVLSLGCVV IIIAANIVGL GMAS