Gene YpsIP31758_2172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_2172
Symbol
ID	5387186
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	2497608
End bp	2498876
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	52%
IMG OID	640865159
Product	carbohydrate ABC transporter periplasmic-binding protein
Protein accession	YP_001401145
Protein GI	153948120
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.00849198
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCATAA AAAAAATAGG TATCGCAGGT ATTATCGGCA CGTTGCTGAT GGCGAGTAAC 
GCCAGCGCAC AGGAAACCCT CCGTGTACTG CTCGAAGGGC ACAGCACCAG CGACTCGATA 
AAAGCACTGT TACCCGAATT CGAAAAGCAG ACCGGTATTA AGGTTCAGGC AGAGATAGTA 
CCTTACAGCG ATCTGACCTC TAAAGCCCTG CTGGCCTTCT CCTCGCACAG TGGACGTTAC 
GACGTGGTTA TGGATGACTG GGTGCATGCA GTAGGTTACG CCTCTGCTGG TTATATCACA 
CCTGTAGATC AGTGGATGGA GAGTGATACC GCCTTCTACG ATGGTGCGGA TTTCGTCAAA 
AGCTATGCTG ATACGCTGCG TTATAAAGAC GGTTATTACG GGCTGCCAGT CTATGGTGAA 
AGTACCTTCC TGATGTACCG CAAAGACCTG TTTGAACAGT ACGGTATCGC CGTGCCGAAA 
ACCTTTGATG AGCTGACCGC TGCGGCAAAA ACCATCAAAG AGAAGACCGA AGGTAAGGTG 
GCGGGTATTA CGCTCCGTGG AGCTCAGGGG ATCCAGAACA CCTTTGCATG GGCGTCATTC 
CTCTGGGGTT ACGGCGGCCA GTGGATTGAC GACAACGGAA AATCTGCAAT TGCTTCGCCA 
CAGGCGGTAG AAGCCACCAA GTCATTCGTC AATATCCTGA AAAACTACGG GCCGATCGGC 
GCGGCTAACT TCGGCTGGCA GGAAAACCGC TTGGTATTCC AGCAGGGTAA AGCGGCAATG 
ACTATCGATT CGACAGTGAA CGGGGGCTTC AACGAAGACC CGAAAGAGTC TACGGTCGTC 
GGTAAAGTGG GCTATGCCCC GGTACCGGTA CAGCCAGGCG ATCATCCAGG TAACAGCGGC 
GCACTTCAGG TGCATGGCTT GTATATCTCC AGCGACAGTA AGAAGCAGGA TGCTGCCTGG 
AAATTTATCA GTTGGGCAAC GGACAAACAG ACGCAGATGA AGTCGGTCGA ACTGAATCCT 
AACGCCGGTG TGAGTTCACT CAGTGCCATC AACAGTGATG CCTTCACCAA GCGTTACGGG 
GCCTTTAAGG ACGGTATGCT CGCAGCATTG CAAAACGGCA ATGCGAAATA CCTCCCAACC 
ATTCCGCAGT CTACACAGAT TATCAACATA ACCGGTATTG CTCTATCCGA GGCACTGGCA 
GGTACTCAGA CAGTAGAAAA TGCCCTTCAG CAAGCCAACA CCCGTAATGA TAAAGCGTTG 
TCCCGTTAA

Protein sequence

MSIKKIGIAG IIGTLLMASN ASAQETLRVL LEGHSTSDSI KALLPEFEKQ TGIKVQAEIV 
PYSDLTSKAL LAFSSHSGRY DVVMDDWVHA VGYASAGYIT PVDQWMESDT AFYDGADFVK 
SYADTLRYKD GYYGLPVYGE STFLMYRKDL FEQYGIAVPK TFDELTAAAK TIKEKTEGKV 
AGITLRGAQG IQNTFAWASF LWGYGGQWID DNGKSAIASP QAVEATKSFV NILKNYGPIG 
AANFGWQENR LVFQQGKAAM TIDSTVNGGF NEDPKESTVV GKVGYAPVPV QPGDHPGNSG 
ALQVHGLYIS SDSKKQDAAW KFISWATDKQ TQMKSVELNP NAGVSSLSAI NSDAFTKRYG 
AFKDGMLAAL QNGNAKYLPT IPQSTQIINI TGIALSEALA GTQTVENALQ QANTRNDKAL 
SR