Gene SeHA_C2680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2680
Symbol	nupG
ID	6491130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	2591350
End bp	2592606
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	49%
IMG OID	642742858
Product	nucleoside permease NupG
Protein accession	YP_002046485
Protein GI	194447355
COG category
COG ID
TIGRFAM ID	[TIGR00889] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	93
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTATTA CGTCCCGCTT AAAAGTCATG TCGTTCTTGC AATATTTTAT CTGGGGGAGC 
TGGCTGGTTA CCCTGGGCTC TTACATGATC AACACTCTGG ATTTTACCGG CGCGAATGTC 
GGTATGGTCT ACAGCTCAAA AGGACTGGCA GCGATTATCA TGCCGGGTAT TATGGGGATC 
ATTGCTGATA AATGGCTGCG CGCTGAGCGA GCCTACATGC TTTGCCATCT GGTTTGCGCG 
GGGGCGTTAT TGTACGCCAC CACCGTTACC GATCCCCAGA CGATGTTCTG GGTGATGTTG 
GTGAATGCGA TGGCGTATAT GCCAACAATT GCATTATCCA ATAGCGTTTC GTACTCCTGT 
CTGGCGAAAG CAGGTCAGGA TCCGGTAACG TCATTTCCGC CTGTGCGCGT TTTCGGCACA 
ATAGGTTTTA TTGTTGCGAT GTGGACGGTG AGCCTGATGG GGCTGGAACT GAGCAGTGCG 
CAATTATACA TCGCTTCTGG CGCATCGTTA TTGCTGGCCC TGTATGCGCT GACGTTACCG 
AAAATTCCGG TAGCCGAGAA GAAGGCGAAC ACCACGCTTG CCAGTAAGCT CGGACTGGAT 
GCTTTTGTTC TGTTTAAAAA TCCACGCATG GCAATCTTCT TTTTGTTTGC GATGATGTTG 
GGGGCGGTGC TGCAAATTAC CAATGTCTTC GGTAATCCGT TCCTGCATGA TTTTGCCCGT 
AATCCTGAGT TTGCCGACAG CTTTGTGGTG AAGTATCCCT CTATCTTGCT TTCAGTTTCG 
CAGATGGCGG AAGTGGGCTT TATCCTCACC ATTCCGTTCT TCCTTAAACG CTTTGGTATT 
AAAACGGTAA TGCTGATGAG TATGCTGGCG TGGACGCTGC GTTTCGGCTT CTTTGCCTTT 
GGCGATCCAT CCCCGTTTGG CTTTGTGCTA CTGCTGCTGT CGATGATTGT TTATGGCTGC 
GCATTTGATT TCTTCAACAT CTCAGGGTCA GTATTTGTAG AGCAGGAGGT GGACTCAAGT 
ATTCGCGCCA GCGCGCAGGG GCTATTTATG ACCATGGTTA ACGGCGTGGG GGCGTGGATT 
GGGTCTCTTT TAAGCGGTAT GGCCGTGGAT TATTTTTCTA TTGATGGCGT AAAAGATTGG 
CAAACTATCT GGCTGGTCTT TGCCGCCTAC GCTCTGGCAT TGGCCGTTAT TTTTGCATTG 
TTCTTTAAAT ATCAGCACCA TCCAGAAAAA CTGTCGACCA AATCATTAGC ACATTAA

Protein sequence

MGITSRLKVM SFLQYFIWGS WLVTLGSYMI NTLDFTGANV GMVYSSKGLA AIIMPGIMGI 
IADKWLRAER AYMLCHLVCA GALLYATTVT DPQTMFWVML VNAMAYMPTI ALSNSVSYSC 
LAKAGQDPVT SFPPVRVFGT IGFIVAMWTV SLMGLELSSA QLYIASGASL LLALYALTLP 
KIPVAEKKAN TTLASKLGLD AFVLFKNPRM AIFFLFAMML GAVLQITNVF GNPFLHDFAR 
NPEFADSFVV KYPSILLSVS QMAEVGFILT IPFFLKRFGI KTVMLMSMLA WTLRFGFFAF 
GDPSPFGFVL LLLSMIVYGC AFDFFNISGS VFVEQEVDSS IRASAQGLFM TMVNGVGAWI 
GSLLSGMAVD YFSIDGVKDW QTIWLVFAAY ALALAVIFAL FFKYQHHPEK LSTKSLAH