Gene YpsIP31758_0979 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpsIP31758_0979
Symbol	tas
ID	5386061
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pseudotuberculosis IP 31758
Kingdom	Bacteria
Replicon accession	NC_009708
Strand	-
Start bp	1170465
End bp	1171505
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	50%
IMG OID	640863946
Product	putative aldo-keto reductase
Protein accession	YP_001399963
Protein GI	153947484
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00000256881
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATATC ATCGTATCCC CCACAGTTCA TTGGAAGTAA GCCTGCTGGG TCTGGGCACC 
ATGACGTTTG GTGAGCAAAA CAGTGAAGCC GATGCCCACG CTCAACTGGA TTATGCCGTT 
GCAGCCGGTA TTAACTTGAT TGATACCGCA GAAATGTACC CGGTGCCTCC AAGGCCAGAA 
ACTCAGGGAT TAACTGAGCA ATATATTGGT CGCTGGATAA AAGCACGCGG TTGCCGCGAA 
AAAATTATTT TAGCCAGTAA AGTCTCCGGG CCATCACGCG GTGATGATCA GCCCATTCGC 
CCGAATATGG CATTGGATCG GAAGAATATC CGCATCGCGC TGGAAGAGAG CCTTAAGCGC 
CTTAATACCG ATTATCTTGA TATTTATCAG TTACATTGGC CTCAGCGGGA AACAAACTGT 
TTCGGTAAGC TGAATTATCG CTATAGCGAG CAAACTGCCG TTGTGACCTT GCTGGAAACA 
CTGGAAGCCC TGAACGAGCA AGTGCGGGCC GGTAAAATTC GTTATATCGG GGTATCCAAT 
GAAACACCAT GGGGTGTCAT GCGTTATCTG CAACTGGCAG AAAAGCATGA TCTACCGCGT 
ATCGTCTCTA TTCAGAACCC TTACAGCCTG TTAAACCGTA GCTTTGAAGT GGGTCTGGCA 
GAGATTAGCC AGCACGAAGG CGTTGAGTTA TTAGCTTATT CCAGCCTGGC TTTTGGCACA 
CTGAGCGGCA AATACCTTAA TGGCGCGAAA CCTGCCGGTG CACGCAACAC CTTGTTCAGC 
CGTTTCACCC GTTACTCTGG GCCACAAACC CAATTAGCGG TGGCTGAATA TGTGTCGCTG 
GCAAAACACC ATGGGCTGGA TCCGGCGCAG ATGGCTCTGG CCTTTGTGCG GCAACAGCCG 
TTTGTTGCCA GTACGCTACT CGGCGCAACG TCGCTGGAAC AACTGAAAAG TAATATTGAT 
AGCCAAAATA TCGTGCTGAG TCAGGAAGTA CTGGATGCAC TGGAAGCGAT CCATACCCGC 
TATACCTTCC CCGCACCTTA A

Protein sequence

MQYHRIPHSS LEVSLLGLGT MTFGEQNSEA DAHAQLDYAV AAGINLIDTA EMYPVPPRPE 
TQGLTEQYIG RWIKARGCRE KIILASKVSG PSRGDDQPIR PNMALDRKNI RIALEESLKR 
LNTDYLDIYQ LHWPQRETNC FGKLNYRYSE QTAVVTLLET LEALNEQVRA GKIRYIGVSN 
ETPWGVMRYL QLAEKHDLPR IVSIQNPYSL LNRSFEVGLA EISQHEGVEL LAYSSLAFGT 
LSGKYLNGAK PAGARNTLFS RFTRYSGPQT QLAVAEYVSL AKHHGLDPAQ MALAFVRQQP 
FVASTLLGAT SLEQLKSNID SQNIVLSQEV LDALEAIHTR YTFPAP