Gene SeD_A2773 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2773
Symbol	nupC
ID	6875076
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	2651445
End bp	2652647
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	51%
IMG OID	642785827
Product	nucleoside transporter NupC
Protein accession	YP_002216483
Protein GI	198244572
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.571863
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	72
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCGCG TCCTTCATTT TGTCCTGGCG CTTGCCGTTG TTGCGGTACT CGCACTGCTG 
GTTAGCAGCG ACCGTAAAAA AATTCGCATT CGTTACGTCA TTCAGTTACT TGTTATCGAA 
GTATTACTGG CCTGGTTCTT CCTGAACTCG GATGTTGGCC TTGGCTTCGT AAAAGGTTTC 
TCCGAGATGT TTGAAAAACT GCTCGGATTT GCCAACGAAG GGACAAACTT CGTCTTCGGC 
AGTATGAACG ATCAAGGTTT GGCGTTCTTC TTCCTGAAAG TATTGTGCCC GATCGTCTTT 
ATTTCCGCGT TGATCGGTAT TCTCCAGCAT ATCCGCGTTC TGCCAGTGGT CATCCGCGCT 
ATTGGTTTCC TGTTGTCCAA AGTAAACGGT ATGGGCAAAC TGGAGTCTTT TAACGCCGTC 
AGCTCGCTGA TCCTCGGCCA GTCTGAGAAC TTTATCGCTT ATAAAGATAT CCTCGGCAAA 
ATGTCCCGTA ACCGCATGTA CACCATGGCG GCGACCGCAA TGTCTACCGT TTCCATGTCT 
ATCGTGGGCG CGTATATGAC CATGCTGGAC CCTAAATATG TGGTCGCAGC GCTGGTTCTG 
AACATGTTCA GCACCTTTAT CGTTCTGTCG CTGATCAACC CCTATGTCGT TGATGCCAGC 
GAAGAAAATA TTCAGATGTC GAACCTGCAT GAAGGCCAAA GTTTCTTCGA AATGCTGGGC 
GAGTACATTC TGGCAGGTTT TAAAGTGGCG ATTATCGTCG CGGCGATGCT GATCGGCTTC 
ATCGCGCTGA TCGCGGCGCT GAACGCGCTG TTCGCAACAG TTACCGGTTG GTTCGGCTAC 
AGCATCTCTT TCCAGGGCAT TCTGGGTTAC ATCTTCTACC CGGTCGCATG GGTAATGGGC 
GTACCGTCCA GTGAAGCGCT GCAGGTAGGA AGTATCATGG CGACCAAACT GGTTTCCAAC 
GAATTCGTGG CGATGATGGA TCTGCAGAAA ATCGCCGCTA CCCTCTCTCC ACGCGCTGAA 
GGCATTATCT CCGTCTTCCT GGTGTCCTTC GCGAACTTCT CTTCCATCGG TATTATTGCG 
GGCGCGATTA AAGGCCTGAA CGAAGAGCAA GGCAACGTGG TTTCCCGTTT TGGTCTGAAA 
CTGGTTTACG GTTCTACGCT GGTGAGCGTA CTGTCCGCCT CTATCGCGGC GCTGGTACTG 
TAA

Protein sequence

MDRVLHFVLA LAVVAVLALL VSSDRKKIRI RYVIQLLVIE VLLAWFFLNS DVGLGFVKGF 
SEMFEKLLGF ANEGTNFVFG SMNDQGLAFF FLKVLCPIVF ISALIGILQH IRVLPVVIRA 
IGFLLSKVNG MGKLESFNAV SSLILGQSEN FIAYKDILGK MSRNRMYTMA ATAMSTVSMS 
IVGAYMTMLD PKYVVAALVL NMFSTFIVLS LINPYVVDAS EENIQMSNLH EGQSFFEMLG 
EYILAGFKVA IIVAAMLIGF IALIAALNAL FATVTGWFGY SISFQGILGY IFYPVAWVMG 
VPSSEALQVG SIMATKLVSN EFVAMMDLQK IAATLSPRAE GIISVFLVSF ANFSSIGIIA 
GAIKGLNEEQ GNVVSRFGLK LVYGSTLVSV LSASIAALVL