Gene SeSA_A2643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A2643
Symbol	nupC
ID	6516474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	2527984
End bp	2529186
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	51%
IMG OID	642747689
Product	nucleoside transporter NupC
Protein accession	YP_002115480
Protein GI	194735794
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCGCG TCCTTCATTT TGTCCTGGCG CTTGCCGTTG TTGCGGTACT CGCACTGCTG 
GTTAGCAGTG ACCGTAAAAA AATTCGCATT CGTTATGTCA TTCAGTTACT TGTTATCGAA 
GTGCTACTGG CCTGGTTCTT CCTGAACTCT GATGTTGGCC TTGGCTTCGT AAAAGGTTTC 
TCCGAGATGT TTGAAAAACT GCTCGGATTT GCCAACGAAG GGACAAACTT CGTCTTCGGC 
AGTATGAACG ATCAAGGTTT GGCGTTCTTC TTCCTGAAAG TATTGTGCCC GATTGTCTTT 
ATTTCCGCGT TGATCGGTAT TCTCCAGCAT ATCCGTGTTC TGCCAGTGGT CATCCGCGCT 
ATTGGTTTCC TGCTGTCCAA AGTAAACGGT ATGGGCAAAC TGGAATCTTT TAACGCCGTC 
AGCTCGCTGA TCCTCGGCCA GTCTGAGAAC TTTATCGCTT ATAAAGATAT CCTCGGCAAA 
ATGTCCCGTA ACCGCATGTA CACCATGGCT GCAACGGCGA TGTCGACCGT TTCCATGTCT 
ATTGTGGGCG CGTATATGAC CATGCTGGAC CCTAAATATG TGGTCGCAGC GCTGGTTCTG 
AACATGTTCA GCACCTTTAT CGTACTGTCG CTGATCAACC CCTATACCGT TGATGCCAGC 
GAAGAAAATA TTCAGATGTC GAACCTGCAT GAAGGCCAAA GTTTCTTCGA AATGCTGGGC 
GAGTACATTC TGGCAGGTTT TAAAGTGGCG ATTATCGTCG CGGCGATGCT GATCGGCTTC 
ATCGCGCTGA TCGCGGCCCT GAACGCCCTG TTCGCCACCG TGACCGGCTG GTTTGGTTAC 
AGCATCTCCT TCCAGGGCAT CCTGGGCTAC ATCTTCTACC CGGTTGCATG GGTAATGGGT 
GTGCCGTCCA GCGAAGCGCT GCAGGTGGGC AGTATCATGG CGACCAAACT GGTTTCCAAC 
GAATTCGTGG CGATGATGGA TCTGCAGAAA ATTGCCGCCA CTCTCTCTCC GCGTGCAGAA 
GGTATCCTGT CCGTCTTCCT GGTATCCTTC GCGAACTTCT CTTCCATCGG TATTATTGCG 
GGCGCGATTA AAGGCCTGAA CGAAGAGCAA GGCAACGTGG TTTCCCGTTT TGGTCTGAAA 
CTGGTTTACG GTTCTACGCT GGTGAGCGTA CTGTCCGCCT CTATCGCGGC GCTGGTACTG 
TAA

Protein sequence

MDRVLHFVLA LAVVAVLALL VSSDRKKIRI RYVIQLLVIE VLLAWFFLNS DVGLGFVKGF 
SEMFEKLLGF ANEGTNFVFG SMNDQGLAFF FLKVLCPIVF ISALIGILQH IRVLPVVIRA 
IGFLLSKVNG MGKLESFNAV SSLILGQSEN FIAYKDILGK MSRNRMYTMA ATAMSTVSMS 
IVGAYMTMLD PKYVVAALVL NMFSTFIVLS LINPYTVDAS EENIQMSNLH EGQSFFEMLG 
EYILAGFKVA IIVAAMLIGF IALIAALNAL FATVTGWFGY SISFQGILGY IFYPVAWVMG 
VPSSEALQVG SIMATKLVSN EFVAMMDLQK IAATLSPRAE GILSVFLVSF ANFSSIGIIA 
GAIKGLNEEQ GNVVSRFGLK LVYGSTLVSV LSASIAALVL