Gene YpsIP31758_4138 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_4138
Symbol	malS
ID	5385644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	4670910
End bp	4672973
Gene Length	2064 bp
Protein Length	687 aa
Translation table	11
GC content	53%
IMG OID	640867167
Product	periplasmic alpha-amylase precursor
Protein accession	YP_001403081
Protein GI	153950894
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACGTC TCACACTCCC CTTGCTACTG GTTCTTTCAC CAGCAGCGAT GGCGAACTGG 
TCCCTACAGC ATTTCCCGGC TTTTACTGAA CAGGACAGCG GTATTTTTCT CAGTAGCAGT 
GCACTGACCA AAGGCGAATA CCCTCTAAAA TTTTATCAGG ATAAACAGTG CTGGCAGCCA 
ACCGGGCCGG TAAAGCTGAA CCAAATGCTC TCGTTGCAGC CTTGCCAGGA GAATATCGCG 
ATACCGTGGC GGTTGTTCCG TGATGGCCAG TATCAAGCGC GAATCGATAC CCGTAGCGGC 
ACCCCGACGC TGACCTTAAG TGTCACCGCA CCCGTAGCGG AGGCAGTCCA GGTCGTCACC 
CACGTTTGCC AACGCTGGGA TGGCAATCCT GTGACCGTGG ATGTCAGTAA AACCTTTGCC 
GAAGGTGAAA TTGTACGGGA TTTCTATTCC GGCCAAACGG CAACCGTTTC TCTCGGCAAA 
ATTACGCTAC GACCTGCCCC AGAGAGTGGT GGTTTACTGC TGTTGGAATC GGCCCAAACA 
CAGCAAGCCG CCCCTTTTAG CTGGCAAAAC GCTACGGTCT ATTTTGCCCT GACGGACAGA 
TTTAATAACG GCAACCCAGC GAACGACCAT AGCTATGGCC GTCATGGCGA TGGGATGCAG 
GAGATAGGAA CGTTTCACGG CGGCGATTTG GCGGGGCTTA CCGAGAAGCT GGATTATCTG 
CAACAGCTTG GGGTCAACGC ACTGTGGATC AGTTCTCCAC TGGAACAAAT TCACGGCTGG 
GTCGGCGGGG GGACCAAAGG CGACTTCCCA CATTATGCCT ATCATGGCTA CTACGGGCTG 
GACTGGACCC GTCTGGATGC CAATATGGGC ACCGAACAGG ATTTACGCAC ACTGGTTGAA 
CAGGCACATA AACGCGGCAT TCGCATCCTA TTTGATGTGG TGATGAATCA TGTGGGTTAT 
GCAACGCTGG CGGATATGCA GAACGACCAA TTCGGGGCGC TCTACCTGCA AGGCGATCAG 
CAGGAAAAAA CCTTGGGTAA GCGTTGGAGC GACTGGACCC CTGGCAGCGG GCAGACCTGG 
CACAGCTTTA ATGACTACAT CAACTTCAGT GATAAGACCG CTTGGGATAA TTGGTGGGGT 
AAAAAATGGA TCCGCACCGA TATTGGTGAT TACGACACCC CCGGTTATGA CGATCTGACG 
ATGTCGCTGG CCTTCCTACC CGATATCAAA ACAGAATCGA CGCAGTCCAG CGGTTTGCCG 
GTGTTTTACC GTAACAAACC GGACACCGCA GCCCAAGAAA TCGCCGGTGC GACACCCCGT 
GATTATATGA CGCATTGGTT AAGCCAATGG GTACGCGATT ACGGCATTGA CGGTTTTCGG 
GTTGATACTG CCAAGCATGT AGAGAAACCC GCCTGGCAAC AATTAAAGCA GCAGAGCATC 
GCGGCACTGG CCGAATGGAA AGCCGCACAT CCAGAACAGG CGCTGGATAA TCTGCCATTT 
TGGATGACCG GAGAGGCTTG GGGCCACGGT GTCATGAAAA GCGATTATTA CCAAAATGGC 
TTTGATGCCA TGATTAATTT TGATTTTCAG GATCAGGCAA ATCAGGCGCT GGCCTGCTTC 
TCATCTATCG AGAGTACCTA CAACCAAATG GCGGAGAAAC TGCAAAACTT CAATGTGTTG 
AGCTACCTCT CGTCTCACGA TACCCGGTTA TTCTTTAAAG ACGATGCACA ACAGTCACTG 
GCAAAACAGC AGCGAGCAGG CTCTTTACTG TTGTTGGCTC CGGGGGCAGT ACAAATCTTC 
TACGGTGATG AAAGCGGGCG GAAGTTTGGC CCAACCGGTT CCGATCCGTT GCAGGGTACC 
CGTTCGGATA TGAACTGGAG TGAGCTATCG GGCGAAAAAG GCGCACTGTT GGCCCATTGG 
CAAAAAGTCA GTCAATTCCG CGCCCGTCAT CCCGCGATAG GCGCTGGTGT ACAACAATCG 
CAACAAACCG CCAATTACTA TGCCTTTAGC CGCCAACATC AGGGCGATAA GGTTCTGGTC 
GTTTGGGTCG GTGATAAGAA CTGA

Protein sequence

MKRLTLPLLL VLSPAAMANW SLQHFPAFTE QDSGIFLSSS ALTKGEYPLK FYQDKQCWQP 
TGPVKLNQML SLQPCQENIA IPWRLFRDGQ YQARIDTRSG TPTLTLSVTA PVAEAVQVVT 
HVCQRWDGNP VTVDVSKTFA EGEIVRDFYS GQTATVSLGK ITLRPAPESG GLLLLESAQT 
QQAAPFSWQN ATVYFALTDR FNNGNPANDH SYGRHGDGMQ EIGTFHGGDL AGLTEKLDYL 
QQLGVNALWI SSPLEQIHGW VGGGTKGDFP HYAYHGYYGL DWTRLDANMG TEQDLRTLVE 
QAHKRGIRIL FDVVMNHVGY ATLADMQNDQ FGALYLQGDQ QEKTLGKRWS DWTPGSGQTW 
HSFNDYINFS DKTAWDNWWG KKWIRTDIGD YDTPGYDDLT MSLAFLPDIK TESTQSSGLP 
VFYRNKPDTA AQEIAGATPR DYMTHWLSQW VRDYGIDGFR VDTAKHVEKP AWQQLKQQSI 
AALAEWKAAH PEQALDNLPF WMTGEAWGHG VMKSDYYQNG FDAMINFDFQ DQANQALACF 
SSIESTYNQM AEKLQNFNVL SYLSSHDTRL FFKDDAQQSL AKQQRAGSLL LLAPGAVQIF 
YGDESGRKFG PTGSDPLQGT RSDMNWSELS GEKGALLAHW QKVSQFRARH PAIGAGVQQS 
QQTANYYAFS RQHQGDKVLV VWVGDKN