Gene SbBS512_E3397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3397
Symbol	nupG
ID	6269905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	+
Start bp	3158937
End bp	3160193
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	50%
IMG OID	641727288
Product	nucleoside permease NupG
Protein accession	YP_001881738
Protein GI	187733605
COG category
COG ID
TIGRFAM ID	[TIGR00889] nucleoside transporter

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCTTA AGCTGCAGCT GAAAATCCTC TCTTTTCTGC AGTTCTGTCT GTGGGGAAGT 
TGGCTGACGA CCCTCGGCTC CTATATGTTT GTTACCCTGA AGTTTGACGG TGCTTCTATT 
GGCGCAGTTT ATAGCTCACT GGGTATCGCA GCGGTCTTTA TGCCTGCGCT GCTGGGGATT 
GTGGCCGACA AATGGTTAAG TGCGAAATGG GTATATGCCA TTTGCCACAC CATTGGCGCT 
ATCACGCTGT TCATGGCGGC ACAGGTCACG ACACCGGAGG CGATGTTCCT TGTGATATTG 
ATTAACTCGT TTGCTTATAT GCCAACGCTT GGGTTAATCA ACACCATCTC TTACTATCGC 
CTGCAAAATG CCGGGATGGA TATCGTTACT GACTTCCCGC CAATCCGTAT CTGGGGCACC 
ATCGGCTTTA TCATGGCAAT GTGGGTGGTG AGCCTGTCTG GCTTCGAATT AAGCCACATG 
CAGCTGTATA TTGGCGCAGC ACTTTCCGCC ATTCTGGTTC TGTTTACCCT GACTCTGCCG 
CATATTCCGG TTGCTAAACA GCAAGCGAAT CAGAGCTGGA CAACCCTGCT GGGCCTCGAT 
GCATTCGCGC TGTTTAAAAA CAAGCGTATG GCAATCTTCT TTATCTTCTC AATGCTGCTG 
GGCGCGGAAC TGCAGATTAC CAACATGTTC GGTAATACCT TCCTGCACAG CTTCGACAAA 
GATCCGATGT TTGCCAGCAG CTTTATTGTG CAGCATGCGT CAATCATCAT GTCGATTTCG 
CAGATCTCTG AAACCCTGTT CATTCTGACC ATCCCGTTCT TCTTAAGCCG CTACGGTATT 
AAGAACGTAA TGATGATCAG TATTGTGGCG TGGATCCTGC GTTTTGCGCT GTTTGCTTAC 
GGCGACCCGA CTCCGTTCGG TACTGTACTG CTGGTACTGT CGATGATCGT TTACGGTTGC 
GCATTCGACT TCTTCAACAT CTCTGGTTCG GTGTTTGTCG AAAAAGAAGT TAGCCCGGCA 
ATTCGCGCCA GTGCACAAGG GATGTTCCTG ATGATGACTA ACGGCTTCGG CTGTATCCTC 
GGCGGCATCG TGAGCGGTAA AGTTGTTGAG ATGTACACCC AAAACGGCAT TACCGACTGG 
CAGACCGTAT GGTTGATTTT CGCTGGTTAC TCCGTGGTTC TGGCCTTCGC GTTCATGGCG 
ATGTTCAAAT ATAAACACGT TCGTGTCCCG ACAGGCACAC AGACGGTTAG CCACTAA

Protein sequence

MNLKLQLKIL SFLQFCLWGS WLTTLGSYMF VTLKFDGASI GAVYSSLGIA AVFMPALLGI 
VADKWLSAKW VYAICHTIGA ITLFMAAQVT TPEAMFLVIL INSFAYMPTL GLINTISYYR 
LQNAGMDIVT DFPPIRIWGT IGFIMAMWVV SLSGFELSHM QLYIGAALSA ILVLFTLTLP 
HIPVAKQQAN QSWTTLLGLD AFALFKNKRM AIFFIFSMLL GAELQITNMF GNTFLHSFDK 
DPMFASSFIV QHASIIMSIS QISETLFILT IPFFLSRYGI KNVMMISIVA WILRFALFAY 
GDPTPFGTVL LVLSMIVYGC AFDFFNISGS VFVEKEVSPA IRASAQGMFL MMTNGFGCIL 
GGIVSGKVVE MYTQNGITDW QTVWLIFAGY SVVLAFAFMA MFKYKHVRVP TGTQTVSH