Gene YpAngola_A3243 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	YpAngola_A3243
Symbol	tas
ID	5801719
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Yersinia pestis Angola
Kingdom	Bacteria
Replicon accession	NC_010159
Strand	+
Start bp	3440094
End bp	3441134
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	50%
IMG OID	641341071
Product	putative aldo-keto reductase
Protein accession	YP_001607594
Protein GI	162420318
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000000690689
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.0202789
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAATATC ATCGTATCCC CCACAGTTCA TTGGAAGTAA GCCTGCTGGG TCTGGGCACC 
ATGACGTTTG GTGAGCAAAA CAGTGAAGCC GATGCCCACG CTCAACTGGA TTATGCCGTT 
GCAGCCGGTA TTAACTTGAT TGATACCGCA GAAATGTACC CGGTGCCTCC AAGGCCAGAA 
ACTCAGGGAT TAACTGAGCA ATATATTGGT CGCTGGATAA AAGCACGCGG TTGCCGCGAA 
AAAATTATTT TAGCCAGTAA AGTCTCCGGG CCATCACGCG GTGATGATCA GCCCATTCGC 
CCGAATATGG CATTGGATCG GAAGAATATC CGCATCGCGC TGGAAGAGAG CCTTAAGCGC 
CTTAATACCG ATTATCTTGA TATTTATCAG TTACATTGGC CTCAGCGGGA AACAAACTGT 
TTCGGTAAGC TGAATTATCG CTATAGCGAG CAAACTGCCG TTGTGACCTT GCTGGAAACA 
CTGGAAGCCC TGAACGAGCA AGTGCGGGCC GGTAAAATTC GTTATATCGG GGTATCCAAT 
GAAACACCAT GGGGTGTCAT GCGTTATCTG CAACTGGCAG AAAAGCATGA TCTACCGCGT 
ATCGTCTCTA TTCAGAACCC TTACAGCCTG TTAAACCGTA GCTTTGAAGT GGGTCTGGCA 
GAGATTAGCC AGCACGAAGG CGTTGAGTTA TTAGCTTATT CCAGCCTGGC TTTTGGCACA 
CTGAGCGGCA AATACCTTAA TGGCGCGAAA CCTGCCGGTG CACGCAACAC CTTGTTCAGC 
CGTTTCACCC GTTACTCTGG GCCACAAACC CAATTAGCGG TGGCTGAATA TGTGTCGCTG 
GCAAAACACC ATGGGCTGGA TCCGGCGCAG ATGGCTCTGG CCTTTGTGCG GCAACAGCCG 
TTTGTTGCCA GTACGCTACT CGGCGCAACG TCGCTGGAAC AACTGAAAAG TAATATTGAT 
AGCCAAAATA TCGTGCTGAG TCAGGAAGTA CTGGATGCAC TGGAAGCGAT CCATACCCGC 
TATACCTTCC CCGCACCTTA A

Protein sequence

MQYHRIPHSS LEVSLLGLGT MTFGEQNSEA DAHAQLDYAV AAGINLIDTA EMYPVPPRPE 
TQGLTEQYIG RWIKARGCRE KIILASKVSG PSRGDDQPIR PNMALDRKNI RIALEESLKR 
LNTDYLDIYQ LHWPQRETNC FGKLNYRYSE QTAVVTLLET LEALNEQVRA GKIRYIGVSN 
ETPWGVMRYL QLAEKHDLPR IVSIQNPYSL LNRSFEVGLA EISQHEGVEL LAYSSLAFGT 
LSGKYLNGAK PAGARNTLFS RFTRYSGPQT QLAVAEYVSL AKHHGLDPAQ MALAFVRQQP 
FVASTLLGAT SLEQLKSNID SQNIVLSQEV LDALEAIHTR YTFPAP