Gene YpAngola_A2082 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A2082
Symbol
ID	5800552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	2157186
End bp	2158454
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	52%
IMG OID	641339996
Product	carbohydrate ABC transporter periplasmic-binding protein
Protein accession	YP_001606542
Protein GI	162419038
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.890991
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.0137332
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATAA AAAAAATAGG TATCGCAGGT ATTATCGGCA CGTTGCTGAT GGCGGGTAAC 
GCCAGCGCAC AGGAAACCCT CCGTGTACTG CTCGAAGGGC ACAGCACCAG CGACTCGATA 
AAAGCACTGT TACCCGAATT CGAAAAGCAG ACCGGTATTA AGGTTCAGGC AGAGATAGTA 
CCTTACAGCG ATCTGACCTC TAAAGCCCTG CTGGCCTTCT CCTCGCACAG TGGACGTTAC 
GACGTGGTTA TGGATGACTG GGTGCATGCG GTAGGTTACG CCTCTGCTGG TTATATCACA 
CCTGTAGATC AGTGGATGGA GAGTGATACC GCCTTCTACG ATGGTGCGGA TTTCGTCAAA 
AGCTATGCTG ATACGCTGCG TTATAAAGAC GGTTATTACG GGCTGCCAGT CTATGGTGAA 
AGTACCTTCC TGATGTACCG CAAAGACCTG TTTGAACAGT ACGGTATCGC CGTGCCGAAA 
ACCTTTGATG AGCTGACCGC TGCGGCAAAA ACCATCAAAG AGAAGACCGA AGGTAAGGTG 
GCGGGTATTA CGCTCCGTGG AGCTCAGGGG ATCCAGAACA CCTTTGCATG GGCGTCATTC 
CTCTGGGGTT ACGGCGGCCA GTGGATTGAC GACAACGGAA AATCTGCAAT TACTTCGCCA 
CAGGCGGTAG AAGCCACCAA GTCATTCGTC AATATCCTGA AAAACTACGG GCCGATCGGC 
GCGGCTAACT TCGGCTGGCA GGAAAACCGC TTGGTATTCC AGCAGGGCAA AGCGGCAATG 
ACTATCGATT CGACAGTGAA CGGGGGCTTC AACGAAGACC CGAAAGAGTC CACGGTCGTC 
GGTAAAGTGG GCTATGCCCC GGTACCGGTA CAGCCAGGCG ATCATCCGGG TAACAGCGGC 
GCACTTCAGG TGCATGGCTT GTATATCTCC AGCGACAGTA AGAAGCAGGA TGCTGCCTGG 
AAATTTATCA GTTGGGCAAC GGACAAACAG ACGCAGATGA AGTCGGTCGA ACTGAATCCT 
AACGCCGGTG TGAGTTCACT CAGTGCCATC AACAGTGATG CCTTCACCAA GCGTTACGGG 
GCCTTTAAGG ATGGTATGCT CGCAGCATTG CAAAACGGCA ATGCGAAATA CCTCCCAACC 
ATTCCGCAGT CTACACAGAT TATCAACATA ACCGGTATTG CTCTATCCGA GGCACTGGCA 
GGTACTCAGA CAGTAGAAAA TGCCCTTCAG CAAGCCAACA CCCGTAATGA TAAAGCGTTG 
TCCCGTTAA

Protein sequence

MSIKKIGIAG IIGTLLMAGN ASAQETLRVL LEGHSTSDSI KALLPEFEKQ TGIKVQAEIV 
PYSDLTSKAL LAFSSHSGRY DVVMDDWVHA VGYASAGYIT PVDQWMESDT AFYDGADFVK 
SYADTLRYKD GYYGLPVYGE STFLMYRKDL FEQYGIAVPK TFDELTAAAK TIKEKTEGKV 
AGITLRGAQG IQNTFAWASF LWGYGGQWID DNGKSAITSP QAVEATKSFV NILKNYGPIG 
AANFGWQENR LVFQQGKAAM TIDSTVNGGF NEDPKESTVV GKVGYAPVPV QPGDHPGNSG 
ALQVHGLYIS SDSKKQDAAW KFISWATDKQ TQMKSVELNP NAGVSSLSAI NSDAFTKRYG 
AFKDGMLAAL QNGNAKYLPT IPQSTQIINI TGIALSEALA GTQTVENALQ QANTRNDKAL 
SR