Gene SeHA_C3354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3354
Symbol	nupG
ID	6491357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	3263822
End bp	3265078
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	51%
IMG OID	642743487
Product	nucleoside permease NupG
Protein accession	YP_002047103
Protein GI	194450077
COG category
COG ID
TIGRFAM ID	[TIGR00889] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.650502
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	74
Fosmid unclonability p-value	0.93107
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCTTA AGCTGCAGCT TAAAATACTC TCTTTTCTGC AGTTCTGTCT GTGGGGAAGC 
TGGCTCACTA CCCTGGGCTC GTATATGTTC GTCACCTTAA AATTTGACGG CGCATCTATT 
GGCGCAGTTT ATAGTTCACT GGGGATTGCC GCCGTCTTTA TGCCGACCTT GCTAGGCATT 
GTGGCTGACA AATGGCTGAG CGCGAAATGG GTCTATGCCC TGTGTCATGT TGTCGGCGCC 
ATCACGCTAT TCATGGCCGC GGAAGTCACT ACGCCTGGGG CGATGTTCTT TGTGATCCTG 
CTTAACTCGT TGGCCTATAT GCCGACGTTG GGCTTGATCA ATACCATATC GTATTACCGC 
CTGCAGTCTG CCGGCATGGA TATTGTGACT GACTTTCCGC CTATCCGTAT CTGGGGCACC 
ATTGGCTTTA TTCTGGCGAT GTGGGGCGTG AGTTTCTCCG GTTTCGAGCT GAGCCATATG 
CAGCTTTATA TCGGCGCGAC GCTTTCCGTT CTGCTGGTAC TGTTTACCTT TACCCTGCCG 
CACATTCCGG TGGCGAACCA ACAGAAAAAC CAGAGCTGGA CATCAATGCT GGGCCTTGAC 
GCTTTTGCGC TGTTTAAAAA TAAGCGGATG GCGATTTTCT TCATCTTCTC CATGATGCTG 
GGCGCGGAAC TGCAGATCAC TAACATGTTT GGCAACACCT TCCTGCATAG CTTTGATAAA 
GATCCGCTAT TCGCCAGTAG CTTTATCGTG CAGCACGCCT CGGTGATGAT GTCGATTTCG 
CAGATTTCTG AAACGTTATT CATCCTGACC ATTCCGTTCT TCCTGAGCCG CTATGGTATT 
AAGAACGTTA TGCTTATCAG TATTGTGGCG TGGATGCTGC GTTTCGGCCT GTTCGCTTAT 
GGCGACCCGA CGCCGTTCGG TACCGTTCTG CTGGTATTGT CGATGATTGT GTACGGCTGC 
GCCTTCGACT TCTTCAACAT TTCTGGCTCG GTGTTTGTCG AAAAAGAAGT ACGCCCGGAA 
ATCCGCGCCA GCGCGCAGGG GATGTTCCTG ATGATGACCA ATGGCTTCGG CTGTATCCTG 
GGCGGCATTG TGAGCGGTAA AGTGGTGGAG TATTACACTC AAAACGGCAT TACCGACTGG 
CAGACCGTGT GGCTCATCTT CGCAGGCTAC TCGCTGGTGC TGGCCTTCGC GTTCGTAGCC 
TTGTTCAAAT ACAAACACGT TCGCGTTCCG GCAAGTTCGC AACCCGTTGC ACATTAA

Protein sequence

MNLKLQLKIL SFLQFCLWGS WLTTLGSYMF VTLKFDGASI GAVYSSLGIA AVFMPTLLGI 
VADKWLSAKW VYALCHVVGA ITLFMAAEVT TPGAMFFVIL LNSLAYMPTL GLINTISYYR 
LQSAGMDIVT DFPPIRIWGT IGFILAMWGV SFSGFELSHM QLYIGATLSV LLVLFTFTLP 
HIPVANQQKN QSWTSMLGLD AFALFKNKRM AIFFIFSMML GAELQITNMF GNTFLHSFDK 
DPLFASSFIV QHASVMMSIS QISETLFILT IPFFLSRYGI KNVMLISIVA WMLRFGLFAY 
GDPTPFGTVL LVLSMIVYGC AFDFFNISGS VFVEKEVRPE IRASAQGMFL MMTNGFGCIL 
GGIVSGKVVE YYTQNGITDW QTVWLIFAGY SLVLAFAFVA LFKYKHVRVP ASSQPVAH