Gene SNSL254_A2614 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2614
Symbol	nupG
ID	6482451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	2532584
End bp	2533840
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	49%
IMG OID	642737947
Product	nucleoside permease NupG
Protein accession	YP_002041681
Protein GI	194442824
COG category
COG ID
TIGRFAM ID	[TIGR00889] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTATTA CGTCCCGCTT AAAAGTCATG TCGTTCTTGC AATATTTTAT CTGGGGGAGC 
TGGCTGGTTA CCCTGGGCTC TTACATGATC AACACTCTGG ATTTTACCGG CGCGAATGTC 
GGTATGGTCT ACAGCTCAAA AGGACTGGCA GCGATTATCA TGCCGGGCAT TATGGGGATC 
ATTGCTGATA AATGGCTGCG CGCTGAGCGA GCCTACATGC TTTGCCATCT GGTTTGCGCG 
GGGGCGTTAT TGTACGCCAC CACCGTTACC GATCCCCAGA CGATGTTCTG GGTGATGTTG 
GTTAATGCGA TGGCGTATAT GCCAACGATT GCATTATCCA ATAGCGTTTC GTACTCCTGT 
CTGGCGAAAG CAGGTCAGGA TCCGGTAACG TCATTTCCGC CTGTGCGCGT TTTCGGCACA 
ATAGGTTTTA TTGTTGCGAT GTGGACGGTG AGCCTGATGG GGCTGGAACT GAGCAGTGCG 
CAATTATACA TCGCTTCTGG CGCATCGTTA TTGCTGGCCC TGTATGCGCT GACGTTACCG 
AAAATTCCGG TAGCCGAGAA GAAGGCGAAC ACCACGCTTG CCAGTAAGCT CGGACTGGAT 
GCTTTTGTTC TGTTTAAAAA TCCACGCATG GCAATCTTCT TTTTGTTTGC GATGATGTTG 
GGGGCGGTGC TGCAAATTAC CAATGTCTTC GGTAATCCGT TCCTGCATGA TTTTGCCCGT 
AATCCTGAGT TTGCCGACAG CTTTGTGGTG AAGTATCCCT CTATCTTGCT TTCAGTTTCG 
CAGATGGCGG AAGTGGGCTT TATCCTCACC ATTCCGTTCT TCCTTAAACG CTTTGGTATT 
AAAACGGTAA TGCTGATGAG TATGCTGGCG TGGACGCTGC GTTTCGGCTT CTTTGCCTTT 
GGCGATCCAT CCCCGTTTGG CTTTGTGCTA CTGCTGCTGT CGATGATTGT TTATGGCTGC 
GCATTTGATT TCTTCAACAT CTCAGGGTCA GTATTTGTAG AGCAGGAGGT GGACTCAAGT 
ATTCGCGCCA GCGCGCAGGG GCTATTTATG ACCATGGTTA ACGGCGTGGG GGCGTGGATT 
GGGTCTCTTT TAAGCGGTAT GGCCGTGGAT TATTTTTCTA TTGATGGTGT AAAAGATTGG 
CAAACCATTT GGCTGGTTTT TGCCGCCTAC GCTCTGGCAT TGGCCGTTAT TTTTGCATTG 
TTCTTTAAAT ATCAGCACCA TCCAGAAAAA CTGTCGACCA AATCATTAGC ACATTAA

Protein sequence

MGITSRLKVM SFLQYFIWGS WLVTLGSYMI NTLDFTGANV GMVYSSKGLA AIIMPGIMGI 
IADKWLRAER AYMLCHLVCA GALLYATTVT DPQTMFWVML VNAMAYMPTI ALSNSVSYSC 
LAKAGQDPVT SFPPVRVFGT IGFIVAMWTV SLMGLELSSA QLYIASGASL LLALYALTLP 
KIPVAEKKAN TTLASKLGLD AFVLFKNPRM AIFFLFAMML GAVLQITNVF GNPFLHDFAR 
NPEFADSFVV KYPSILLSVS QMAEVGFILT IPFFLKRFGI KTVMLMSMLA WTLRFGFFAF 
GDPSPFGFVL LLLSMIVYGC AFDFFNISGS VFVEQEVDSS IRASAQGLFM TMVNGVGAWI 
GSLLSGMAVD YFSIDGVKDW QTIWLVFAAY ALALAVIFAL FFKYQHHPEK LSTKSLAH