Gene SbBS512_E2761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E2761
Symbol	nupC
ID	6271857
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	2567743
End bp	2568945
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	50%
IMG OID	641726720
Product	nucleoside transporter NupC
Protein accession	YP_001881199
Protein GI	187732844
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1972] Nucleoside permease
TIGRFAM ID	[TIGR00804] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.246953
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACCGCG TCCTTCATTT TGTACTGGCA CTTGCCGTTG TTGCGATTCT CGCACTGCTG 
GTAAGCAGCG ACCGCAAAAA AATTCGTATC CGTTATGTTA TTCAACTGCT TGTTATCGAA 
GTGTTACTGG CGTGGTTCTT CCTGAACTCC GACGTTGGTT TAGGCTTCGT GAAAGGCTTC 
TCCGAAATGT TCGAAAAACT GCTCGGATTT GCCAACGAAG GGACTAACTT CGTCTTTGGT 
AGCATGAATG ATCAAGGCCT GGCATTCTTC TTCCTGAAAG TGCTGTGCCC AATCGTCTTT 
ATCTCTGCAC TGATCGGTAT TCTCCAGCAC ATTCGCGTGT TGCCGGTGAT CATCCGCGCA 
ATTGGTTTCC TGCTCTCCAA AGTCAACGGC ATGGGCAAAC TGGAATCCTT TAACGCCGTC 
AGCTCCCTGA TTCTGGGTCA GTCTGAAAAC TTTATTGCCT ATAAAGATAT CCTCGGCAAA 
ATCTCCCGTA ATCGTATGTA CACCATGGCT GCCACGGCAA TGTCCACCGT GTCGATGTCC 
ATCGTTGGTG CATACATGAC CATGCTGGAA CCGAAATACG TCGTTGCTGC GCTGGTATTG 
AACATGTTCA GCACCTTTAT CGTGCTGTCG CTGATCAACC CTTACCGTGT TGATGCCAGT 
GAAGAAAACA TTCAGATGTC CAACCTGCAC GAAGGTCAGA GCTTCTTCGA AATGCTGGGT 
GAATACATTC TGGCAGGTTT CAAAGTTGCC ATTATCGTTG CCGCGATGCT GATCGGCTTT 
ATCGCCCTGA TCGCTGCGCT GAACGCACTG TTTGCCACCG TGACTGGCTG GTTTGGCTAC 
AGCATCTCCT TCCAGGGCAT TCTGGGCTAC ATCTTCTATC CGATTGCATG GGTGATGGGT 
GTTCCTTCCA GTGAAGCACT GCAAGTGGGC AGTATCATGG CGACCAAACT GGTTTCCAAC 
GAGTTCGTTG CGATGATGGA TCTGCAGAAA ATTGCTTCCA CGCTCTCTCC GCGTGCTGAA 
GGCATCATCT CTGTGTTCCT GGTTTCCTTC GCTAACTTCT CTTCAATCGG GATTATCGCA 
GGTGCAGTTA AAGGCCTGAA TGAAGAGCAA GGTAACGTGG TTTCTCGCTT CGGTCTGAAA 
CTGGTTTACG GCTCTACCCT GGTGAGTGTG CTGTCTGCGT CAATCGCAGC ACTGGTGCTG 
TAA

Protein sequence

MDRVLHFVLA LAVVAILALL VSSDRKKIRI RYVIQLLVIE VLLAWFFLNS DVGLGFVKGF 
SEMFEKLLGF ANEGTNFVFG SMNDQGLAFF FLKVLCPIVF ISALIGILQH IRVLPVIIRA 
IGFLLSKVNG MGKLESFNAV SSLILGQSEN FIAYKDILGK ISRNRMYTMA ATAMSTVSMS 
IVGAYMTMLE PKYVVAALVL NMFSTFIVLS LINPYRVDAS EENIQMSNLH EGQSFFEMLG 
EYILAGFKVA IIVAAMLIGF IALIAALNAL FATVTGWFGY SISFQGILGY IFYPIAWVMG 
VPSSEALQVG SIMATKLVSN EFVAMMDLQK IASTLSPRAE GIISVFLVSF ANFSSIGIIA 
GAVKGLNEEQ GNVVSRFGLK LVYGSTLVSV LSASIAALVL