Gene SeD_A3457 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3457
Symbol	nupG
ID	6871155
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	3318516
End bp	3319772
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	51%
IMG OID	642786451
Product	nucleoside permease NupG
Protein accession	YP_002217089
Protein GI	198245802
COG category
COG ID
TIGRFAM ID	[TIGR00889] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.693342
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTTA AGCTGCAGCT TAAAATACTC TCTTTTCTGC AGTTCTGTCT GTGGGGAAGC 
TGGCTCACTA CCCTGGGCTC GTATATGTTC GTCACCTTAA AATTTGACGG CGCATCTATT 
GGCGCAGTTT ATAGTTCACT GGGGATTGCC GCCGTCTTTA TGCCGACCTT GCTAGGCATT 
GTGGCTGACA AATGGCTGAG CGCGAAATGG GTCTATGCCC TGTGTCATGT TCTCGGCGCC 
ATCACGCTAT TCATGGCCGC GGAAGTCACT ACGCCTGGGG CGATGTTCTT TGTGATCCTG 
CTTAACTCGT TGGCCTATAT GCCGACGTTG GGCTTGATCA ATACTATATC GTATTACCGC 
CTGCAGTCTG CCGGCATGGA TATTGTGACT GACTTCCCGC CTATCCGTAT CTGGGGCACC 
ATTGGCTTTA TTCTGGCGAT GTGGGGCGTG AGTTTCTCCG GTTTCGAGCT GAGCCATATG 
CAGCTTTATA TCGGCGCGAC GCTTTCCGTT CTGCTGGTAC TGTTTACCTT TACCCTGCCG 
CACATTCCGG TGGCGAACCA ACAGAAAAAC CAGAGCTGGA CATCAATGCT GGGCCTTGAC 
GCTTTTGCGC TGTTTAAAAA TAAGCGGATG GCGATTTTCT TCATCTTCTC CATGATGCTG 
GGCGCGGAAC TGCAGATCAC CAACATGTTT GGCAACACCT TCCTGCATAG CTTTGATAAA 
GATCCGCTAT TCGCCAGTAG CTTTATCGTG CAGCACGCCT CGGTGATGAT GTCGATTTCG 
CAGATTTCTG AAACGTTATT CATCCTGACC ATTCCGTTCT TCCTGAGCCG TTATGGTATT 
AAGAACGTTA TGCTTATCAG TATTGTGGCG TGGATGCTGC GTTTCGGCCT GTTCGCTTAT 
GGCGACCCGA CGCCGTTCGG TACCGTTCTG CTGGTATTGT CGATGATTGT GTACGGCTGC 
GCCTTCGACT TCTTCAACAT TTCTGGCTCG GTGTTTGTCG AAAAAGAAGT ACGCCCGGAA 
ATCCGCGCCA GCGCGCAGGG GATGTTCCTG ATGATGACCA ATGGCTTCGG CTGTATCCTT 
GGCGGCATTG TGAGCGGTAA AGTGGTGGAG TATTACACTC AAAACGGCAT TACCGACTGG 
CAGACCGTGT GGCTCATCTT CGCAGGCTAC TCGCTGGTGC TGGCCTTCGC GTTCGTAGCC 
TTGTTCAAAT ACAAACACGT TCGCGTTCCG GCAAGTTCGC AACCCGTTGC ACATTAA

Protein sequence

MNLKLQLKIL SFLQFCLWGS WLTTLGSYMF VTLKFDGASI GAVYSSLGIA AVFMPTLLGI 
VADKWLSAKW VYALCHVLGA ITLFMAAEVT TPGAMFFVIL LNSLAYMPTL GLINTISYYR 
LQSAGMDIVT DFPPIRIWGT IGFILAMWGV SFSGFELSHM QLYIGATLSV LLVLFTFTLP 
HIPVANQQKN QSWTSMLGLD AFALFKNKRM AIFFIFSMML GAELQITNMF GNTFLHSFDK 
DPLFASSFIV QHASVMMSIS QISETLFILT IPFFLSRYGI KNVMLISIVA WMLRFGLFAY 
GDPTPFGTVL LVLSMIVYGC AFDFFNISGS VFVEKEVRPE IRASAQGMFL MMTNGFGCIL 
GGIVSGKVVE YYTQNGITDW QTVWLIFAGY SLVLAFAFVA LFKYKHVRVP ASSQPVAH