Gene YPK_3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YPK_3044
Symbol
ID	6089114
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis YPIII
Kingdom	Bacteria
Replicon accession	NC_010465
Strand	-
Start bp	3345405
End bp	3346952
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	54%
IMG OID	641598124
Product	ABC transporter related
Protein accession	YP_001721770
Protein GI	170025265
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCAAC CTTTATTGAA AATCACCGAT ATGGCGAAAA GCTTCTCTGG TGTCTGGGCG 
CTCAGTAACG TACAGCTCAC CGTAGAGCAG GGTGAAATAC ATGCACTCTT GGGTGAGAAC 
GGCGCAGGTA AATCAACACT CTTGAAAGCA CTCTCGGGTG CTCAACCCCA GACTCACGGC 
GAAATCTGGT TTAACGGTGA AATGCTGGCA TTGGACGACT CGCCAGTGGA ACGCCAGAAC 
AAAGGCATTA TCACCATCTA TCAAGAAGTT AACCTACTGC CCAACATGAC GGTGGCAGAA 
AACATGTTTC TTGGTCGTGA ACCGCGCCGC CGTCAGGTAT TTGTCGACGA AAAAGCCGTC 
AATCAGGAAG CCCAAGCGAT CCTCGATTAC CTGCAACTTA ACGTGTCACC CACCACGGCG 
GTGGCGCGCT TGAGTATCGC GCAGCAACAG ATGGTAGAGA TCGCCCGGGC GCTGACCTTG 
AACGCGAAGC TCATTGTCAT GGATGAGCCT TCGGCAGCAC TCAGCGACAG CGAAGTCGAA 
AGCCTGCATC GCGTGGTACG GGAACTGAAA GGCCGTGGTG TGAGCATTAT CTATGTCACC 
CACCGCTTGC ACGAAGTGTT CCAACTCTGT GATCGTTTCA CGGTGTTTCA GGATGGGCGT 
TACACCGGTT CTGATGAGGT TGCAGGCACC AACGTTGAGA AGATTATCCG CCTGATGGTG 
GGGCGAGACG TCGTATTTAA CCGCCGCCCC GCCAGTGAGA CCCATCACCA AGACCAGCCC 
ATTCGCCTAT CTGTGCAAGG GCTGTGTCGT GAAAAACCCC CGCTCGATCC ACATGGTGTG 
GCGCTAAAAG ACATCAGCTT TCACGTCCAC GCCGGGGAAG TCCTGGGTAT CGCCGGGTTG 
GTAGGGGCAG GGCGTACCGA AGTGGCACGT TGTCTGTTTG GGGCGGGGGC TTTCACCTCT 
GGCAATTTTG AGATAGACGG TATGCCCTAT CAGCCACGGG ATCCAATGTT CGCGCTGGAA 
CAGGGGATCG CACTGGTGCC GGAAGACCGT AAAAAAGAGG GGGCAGTGCA AGGGCTTTCT 
ATTCGCGACA ATCTGACACT TTCGAGCCTG GCCGGGCTGT TACAGTGGCG TTTTTTCGTC 
AATACCCGCA AAGAAGATCA ACTGATTGAG ACCTACCGTT TAGCACTGCA AATCAAGATG 
GTGAACAGCG AACAGGCGGT GCGTAAGCTC TCTGGCGGTA ACCAGCAGAA GGTGATCTTG 
GCCCGCTGCA TGGCGCTCAA TCCACGGATC CTGATCGTCG ATGAACCGAC ACGGGGCATT 
GATGTGGGCA CGAAATCGGA AGTGCATCAG GTGTTGTTTG ATATGGCTAA ACAGGGCGTG 
GCAGTGATCG TCATCTCCTC GGATTTACCG GAAGTTCTCG CGGTTTCTGA CCGGATCATC 
ACGCTAAGCG AAGGGCGAGT CACTGGAGAG ATTCACGGTG ATGACGCCAG CGAAGAACGG 
CTGATGACCA TGATGGCCAT CAATCATAAC GCCTTAAATG CCGCCTAA

Protein sequence

MSQPLLKITD MAKSFSGVWA LSNVQLTVEQ GEIHALLGEN GAGKSTLLKA LSGAQPQTHG 
EIWFNGEMLA LDDSPVERQN KGIITIYQEV NLLPNMTVAE NMFLGREPRR RQVFVDEKAV 
NQEAQAILDY LQLNVSPTTA VARLSIAQQQ MVEIARALTL NAKLIVMDEP SAALSDSEVE 
SLHRVVRELK GRGVSIIYVT HRLHEVFQLC DRFTVFQDGR YTGSDEVAGT NVEKIIRLMV 
GRDVVFNRRP ASETHHQDQP IRLSVQGLCR EKPPLDPHGV ALKDISFHVH AGEVLGIAGL 
VGAGRTEVAR CLFGAGAFTS GNFEIDGMPY QPRDPMFALE QGIALVPEDR KKEGAVQGLS 
IRDNLTLSSL AGLLQWRFFV NTRKEDQLIE TYRLALQIKM VNSEQAVRKL SGGNQQKVIL 
ARCMALNPRI LIVDEPTRGI DVGTKSEVHQ VLFDMAKQGV AVIVISSDLP EVLAVSDRII 
TLSEGRVTGE IHGDDASEER LMTMMAINHN ALNAA