Gene YpsIP31758_1058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_1058
Symbol
ID	5387264
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	+
Start bp	1262448
End bp	1263398
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	50%
IMG OID	640864034
Product	polysaccharide deacetylase family protein
Protein accession	YP_001400039
Protein GI	153950026
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID	[TIGR03212] putative urate catabolism protein

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATGAGA CTGAACTTAA TCATGATTAT CCACGGGATT TGGCCGGTTA CGGTGGCCAA 
CCCCCAGTCG CTAACTGGCC GGGGCAGGCA CGTATTGCGG TGCAATTTGT CCTGAATATT 
GAAGAAGGTG CGGAAAATAA CGTTCTACAT GGCGATGCGG GATCTGAACA ATTTCTTTCC 
GATATTATCG GTGCGGACAG TTATCCCGAT AGGCATATGT CGATGGAGTC ACTTTACGAA 
TATGGAACTC GTGCTGGCTT CTGGCGTATC CATCAGGAGT TTGTTTCTCG GGGGCTGCCT 
ATGACGGTCT TTGGTGTCGC CATGGCATTG GAGCGTAATC CATTGATTGT CGAAGCGATT 
AAGTGTGCGG GTTATGATGT GGTTTGCCAT GGCTGGCGTT GGCTCCATTA TCAACACGTC 
GATGAGCAAA CTGAACGTGA GCATATGCAG CGGGCCATCA AGATATTACA TGATTTATTC 
GGCCAACCCC CTGCAGGCTG GTATACCGGG CGTGATAGCC CAAATACCCG GCGGCTGGTG 
GTGGAGAATG GTCACCTTCT GTACGACAGC GATTATTATG GCGATGATTT GCCCTTTTGG 
TCGCAGGTCA GGGGAGTTGA TGGCAGTACC ACCCCACATC TGGTCGTGCC TTATACACTG 
GATGCCAATG ATATGCGTTT TGCCTCAGCA CAGGGATTTA ACTCCAGTGA GCAGTTTTAT 
ACCTATTTAA AAGACAGCTT CGATGTGTTG TACGCAGAGG GTGAAACTGC ACCTAAAATG 
ATGTCAGTGG GGATGCACTG TCGGTTATTA GGGCGCCCTG GACGTTTCCG GGCTTTGCAG 
CGCTTTTTGG ATTATATCCA GCAACACGAA AGGGTGTGGG TTTGTCGGCG TCAAGAGATT 
GCGGAGCATT GGGTTAAACA TCACCCGTTT GAAGGTATCA ATGGCCGGTA G

Protein sequence

MHETELNHDY PRDLAGYGGQ PPVANWPGQA RIAVQFVLNI EEGAENNVLH GDAGSEQFLS 
DIIGADSYPD RHMSMESLYE YGTRAGFWRI HQEFVSRGLP MTVFGVAMAL ERNPLIVEAI 
KCAGYDVVCH GWRWLHYQHV DEQTEREHMQ RAIKILHDLF GQPPAGWYTG RDSPNTRRLV 
VENGHLLYDS DYYGDDLPFW SQVRGVDGST TPHLVVPYTL DANDMRFASA QGFNSSEQFY 
TYLKDSFDVL YAEGETAPKM MSVGMHCRLL GRPGRFRALQ RFLDYIQQHE RVWVCRRQEI 
AEHWVKHHPF EGINGR