Gene YpsIP31758_2100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_2100
Symbol
ID	5386202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	2412400
End bp	2413587
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	51%
IMG OID	640865086
Product	UDP-glycosyltransferase family protein
Protein accession	YP_001401073
Protein GI	153946869
COG category	[C] Energy production and conversion [G] Carbohydrate transport and metabolism
COG ID	[COG1819] Glycosyl transferases, related to UDP-glucuronosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGACGT TAGATGATTT GATCCCCCCG GCTACCCGCT GTATCGATCT GCTGGCCCCG 
CCTTTTTCTG GGCACTTACA CCCGATACTG GCGTTGGGCC GCATGTTGGC TAAAAATTAC 
GAGGTACGCA TCATCAGCAC GCAAGATGCG CTGGCGCGTA TCACGGCGGC AGGGCTAAAG 
GGCATTGCTT TGCCGGGTGA ATATGACCCG CTGTTACAGG CAATTGCCAA CCCAGACTAT 
GCGGTTAAAA GCAGTCCGCT GAAGCTTTAT CGCCAATTTA AATCTGCGGT TGGGTTACTC 
GTCGAGTTTG CCTCGGCACT GGAAAAACTT TATCAACATG ATGGTGTGCC AGACCTGGTT 
ATTGCTGACT TTACTTTACC CGTGGTAGGG ACGGTGAGTA AAAAATTGGG CATCCCTTGG 
TGGACGAGTT TACCCTCGCC CTGTGTGCTG GAAACGTTAG ACGGCCCACC GGCCTATTGC 
GGTGGCCTTT ATCCAGCGAA AACTGCTATG GATAACGTCA GTCAGTTTAT CGCGCGGAAA 
AAAGTCCGTT GGTTTAAAAA AACGCTTTTT TGGTTATTCC GTAGAACAAT CTCAACAACC 
GGGATCACGG CGTTATATCG CGCCGATGGT ACAGAAAGTG CTTATTCAGC AGACTGTATT 
CTGGCTCTGG GTGATGTCGC ATTTGAATTT ACCCGAACCT GGCCGGAGAG CGTCCATTTT 
ATTGGGCCAG CGCTCTATAC ACCGCCTAAT TTGCAGCCTG CGCCGCACTT TGAAGCAGGT 
CGCCGCCATG TGCTGGTGAC CTTAGGGACT CATCTGGCCT GGCATAAAGA TGAAGTGGTA 
AAGGCGGTTG AGAGACTTGC CCGAACCATG CCAGAGTCGG CTTTTCATTT CACAGAGGGG 
GATCCGAACG CGGCTTGCCA TCAGCAGACC GATAATTTCA TCCGCTTGCC ATGGATAGAT 
TATGAAACCT GTCTTGGTCA CTACGATGTG GTGATTCATC ATGGTGGTGC AGGAATTCTG 
TATTACTGTC TGAAACATAA TATACCGGCG TTGGTCTATC CGGTTGATTT CGATCAATTT 
GACCATGCTG CCCGCCTTGA TGCGTCGGGG AAAGGTCTTT GGTTAAAAGG GGGGCTGAGC 
GCGTTGGCGA ATGCCAAAAC TCAGATTGAG CAGTTAACTG CCCGTTAG

Protein sequence

MKTLDDLIPP ATRCIDLLAP PFSGHLHPIL ALGRMLAKNY EVRIISTQDA LARITAAGLK 
GIALPGEYDP LLQAIANPDY AVKSSPLKLY RQFKSAVGLL VEFASALEKL YQHDGVPDLV 
IADFTLPVVG TVSKKLGIPW WTSLPSPCVL ETLDGPPAYC GGLYPAKTAM DNVSQFIARK 
KVRWFKKTLF WLFRRTISTT GITALYRADG TESAYSADCI LALGDVAFEF TRTWPESVHF 
IGPALYTPPN LQPAPHFEAG RRHVLVTLGT HLAWHKDEVV KAVERLARTM PESAFHFTEG 
DPNAACHQQT DNFIRLPWID YETCLGHYDV VIHHGGAGIL YYCLKHNIPA LVYPVDFDQF 
DHAARLDASG KGLWLKGGLS ALANAKTQIE QLTAR