Gene SeHA_C2667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2667
Symbol	nupC
ID	6490428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	2583106
End bp	2584308
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	51%
IMG OID	642742845
Product	nucleoside transporter NupC
Protein accession	YP_002046478
Protein GI	194449260
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCGCG TCCTTCATTT TGTCCTGGCG CTTGCCGTTG TTGCGGTACT CGCACTGCTG 
GTTAGCAGTG ACCGTAAAAA AATTCGCATT CGTTACGTCA TTCAGTTACT TGTTATCGAA 
GTATTACTGG CCTGGTTCTT CCTGAACTCG GATGTTGGCC TTGGCTTCGT AAAAGGTTTC 
TCCGAGATGT TTGAAAAACT GCTCGGATTT GCCAACGAAG GGACAAACTT CGTCTTCGGC 
AGTATGAACG ATCAAGGTTT GGCGTTCTTC TTCCTGAAAG TATTGTGCCC GATCGTCTTT 
ATTTCCGCGT TGATCGGTAT TCTCCAGCAT ATCCGTGTTC TGCCAGTGGT CATCCGCGCT 
ATTGGTTTCC TGCTGTCCAA AGTAAACGGT ATGGGCAAAC TGGAATCTTT TAACGCCGTC 
AGCTCGCTGA TCCTCGGTCA GTCTGAGAAC TTTATCGCTT ATAAAGATAT CCTCGGCAAA 
ATGTCCCGTA ACCGCATGTA CACCATGGCG GCGACCGCAA TGTCTACCGT TTCCATGTCT 
ATCGTGGGCG CGTATATGAC CATGCTGGAC CCTAAATATG TGGTCGCAGC GCTGGTTCTG 
AACATGTTCA GCACCTTTAT CGTTCTGTCG CTGATCAACC CCTATGTCGT TGATGCCAGC 
GAAGAAAATA TTCAGATGTC GAACCTGCAT GAAGGCCAAA GTTTCTTCGA AATGCTGGGC 
GAGTACATTC TGGCAGGTTT TAAAGTGGCG ATTATCGTCG CGGCGATGCT GATCGGCTTC 
ATCGCGCTGA TCGCGGCGCT GAACGCGCTG TTCGCAACGG TTACCGGTTG GTTCGGCTAC 
AGCATCTCCT TCCAGGGCAT TCTGGGTTAC ATCTTCTACC CGGTCGCATG GGTAATGGGC 
GTACCGTCCA GTGAAGCGCT GCAGGTAGGA AGTATCATGG CGACCAAACT GGTTTCCAAC 
GAATTCGTGG CGATGATGGA TCTGCAGAAA ATCGCCTCTA CCCTCTCTCC ACGCGCTGAA 
GGCATTATCT CCGTCTTCCT GGTGTCCTTC GCGAACTTCT CTTCCATCGG TATTATTGCG 
GGCGCGATTA AAGGCCTGAA CGAAGAGCAA GGCAACGTGG TTTCCCGTTT TGGTCTGAAA 
CTGGTTTACG GTTCTACGCT GGTGAGCGTA CTGTCCGCCT CTATCGCGGC GCTGGTACTG 
TAA

Protein sequence

MDRVLHFVLA LAVVAVLALL VSSDRKKIRI RYVIQLLVIE VLLAWFFLNS DVGLGFVKGF 
SEMFEKLLGF ANEGTNFVFG SMNDQGLAFF FLKVLCPIVF ISALIGILQH IRVLPVVIRA 
IGFLLSKVNG MGKLESFNAV SSLILGQSEN FIAYKDILGK MSRNRMYTMA ATAMSTVSMS 
IVGAYMTMLD PKYVVAALVL NMFSTFIVLS LINPYVVDAS EENIQMSNLH EGQSFFEMLG 
EYILAGFKVA IIVAAMLIGF IALIAALNAL FATVTGWFGY SISFQGILGY IFYPVAWVMG 
VPSSEALQVG SIMATKLVSN EFVAMMDLQK IASTLSPRAE GIISVFLVSF ANFSSIGIIA 
GAIKGLNEEQ GNVVSRFGLK LVYGSTLVSV LSASIAALVL