Gene SNSL254_A2601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2601
Symbol	nupC
ID	6484886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2524236
End bp	2525438
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	51%
IMG OID	642737934
Product	nucleoside transporter NupC
Protein accession	YP_002041674
Protein GI	194444379
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.263795
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	77
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCGCG TCCTTCATTT TGTCCTGGCG CTTGCCGTTG TTGCGGTACT CGCACTGCTG 
GTTAGCAGCG ACCGTAAAAA AATTCGCATT CGTTACGTCA TTCAGTTACT TGTTATCGAA 
GTATTACTGG CCTGGTTCTT CCTGAACTCG GATGTTGGCC TTGGCTTCGT AAAAGGTTTC 
TCCGAGATGT TTGAAAAACT GCTCGGATTT GCCAACGAAG GGACAAACTT CGTCTTTGGC 
AGTATGAACG ATCAAGGTTT GGCGTTCTTC TTCCTGAAAG TATTGTGCCC GATCGTCTTT 
ATTTCCGCGT TGATCGGTAT TCTTCAGCAT ATCCGCGTTC TGCCAGTGGT CATCCGCGCT 
ATTGGTTTTC TGTTGTCCAA AGTAAACGGT ATGGGCAAAC TGGAGTCTTT TAACGCCGTC 
AGCTCGCTGA TCCTCGGCCA GTCTGAGAAC TTTATCGCTT ATAAAGATAT CCTCGGCAAA 
ATGTCCCGTA ACCGCATGTA CACCATGGCG GCGACCGCAA TGTCTACCGT TTCCATGTCT 
ATCGTGGGCG CGTATATGAC CATGCTGGAC CCTAAATATG TGGTCGCAGC GCTGGTTCTG 
AACATGTTCA GCACCTTTAT CGTTCTGTCG CTGATCAACC CCTATGTCGT TGATGCCAGC 
GAAGAAAATA TTCAGATGTC GAACCTGCAT GAAGGCCAAA GTTTCTTCGA AATGCTGGGC 
GAGTACATTC TGGCAGGTTT TAAAGTGGCG ATTATCGTCG CGGCGATGCT GATCGGTTTC 
ATCGCGCTGA TCGCGGCGCT GAACGCGCTG TTCGCAACGG TTACCGGTTG GTTCGGCTAC 
AGCATCTCCT TCCAGGGCAT TCTGGGTTAC ATCTTCTACC CGGTCGCATG GGTAATGGGC 
GTACCGTCCA GTGAAGCGCT GCAGGTAGGA AGTATCATGG CGACCAAACT GGTTTCCAAC 
GAATTCGTGG CGATGATGGA TCTGCAGAAA ATCGCCTCTA CCCTCTCTCC ACGCGCTGAA 
GGCATTATCT CCGTCTTCCT GGTGTCCTTC GCGAACTTCT CTTCCATCGG TATTATTGCG 
GGCGCGATTA AAGGCCTGAA CGAAGAGCAA GGCAACGTGG TTTCCCGTTT TGGTCTGAAA 
CTGGTTTACG GTTCTACGCT GGTGAGCGTA CTGTCCGCCT CTATCGCGGC GCTGGTACTG 
TAA

Protein sequence

MDRVLHFVLA LAVVAVLALL VSSDRKKIRI RYVIQLLVIE VLLAWFFLNS DVGLGFVKGF 
SEMFEKLLGF ANEGTNFVFG SMNDQGLAFF FLKVLCPIVF ISALIGILQH IRVLPVVIRA 
IGFLLSKVNG MGKLESFNAV SSLILGQSEN FIAYKDILGK MSRNRMYTMA ATAMSTVSMS 
IVGAYMTMLD PKYVVAALVL NMFSTFIVLS LINPYVVDAS EENIQMSNLH EGQSFFEMLG 
EYILAGFKVA IIVAAMLIGF IALIAALNAL FATVTGWFGY SISFQGILGY IFYPVAWVMG 
VPSSEALQVG SIMATKLVSN EFVAMMDLQK IASTLSPRAE GIISVFLVSF ANFSSIGIIA 
GAIKGLNEEQ GNVVSRFGLK LVYGSTLVSV LSASIAALVL