Gene SbBS512_E3028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SbBS512_E3028
Symbol	tas
ID	6272738
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shigella boydii CDC 3083-94
Kingdom	Bacteria
Replicon accession	NC_010658
Strand	-
Start bp	2825801
End bp	2826841
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	54%
IMG OID	641726961
Product	putative aldo-keto reductase
Protein accession	YP_001881425
Protein GI	187731999
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.000000422385
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATATC ACCGTATACC CCACAGTTCG CTGGAAGTCA GCACGCTGGG GCTTGGCACG 
ATGACGTTTG GTGAACAGAA CAGCGAAGCC GACGCCCACG CACAACTCGA CTATGCCGTC 
GCTCAGGGCA TTAACCTTAT CGACGTTGCC GAAATGTACC CAGTACCTCC GCGCCCCGAA 
ACGCAAGGGT TAACCGAAAC CTACGTCGGC AACTGGCTGG CGAAACATGG CAGCCGCGAA 
AAGTTAATTA TCGCCTCCAA AGTGAGCGGA CCGTCGCGCA ATAATGACAA GGGCATCCGC 
CCGGATCAGG CGCTGGATCG GAAGAATATC CGCGAAGCGC TGCATGACAG CCTCAAGCGC 
CTACAGACTG ATTACCTCGA TCTTTATCAG GTGCACTGGC CGCAGCGCCC GACCAACTGC 
TTCGGCAAAC TCGGTTATAG CTGGACGGAT TCTGCGCCTG CGGTTTCGCT GCTGGATACG 
CTGGACGCAC TGGCAGAGTA CCAACGCGCG GGAAAAATTC GTTATATCGG CGTGTCGAAC 
GAAACTGCAT TTGGCGTAAT GCGCTACCTG CATCTGGCGG ACAAACACGA TCTGCCGAGT 
ATTGTCACCA TTCAGAACCC TTACAGTCTG TTAAACCGCA GTTTTGAAGT AGGTCTGGCA 
GAAGTCAGCC AGTATGAAGG GGGCGAACTG CTGGCCTATT CATGCCTGGG TTTCGGCACG 
CTGACCGGGA AATATCTCAA TGGTGCAAAA CCCGCTGGCG CACGTAATAC GCTCTTTAGT 
CGGTTCACCC GCTATAGCGG TGAGCAAACG CAAAAAGCCG TCGCGGCGTA TGTTGATATC 
GCCAGACGTC ATGGCCTGGA CCCTGCTCAG ATGGCGCTCG CGTTTGTACG CCGTCAACCG 
TTTGTTGCCA GCACTCTGCT GGGCGCAACC ACGATGGATC AGCTGAAAAC TAACATCGAA 
AGTTTGCATC TGGAGTTAAG CGAAGACGTA TTAGCTGAAA TTGAAGCGGT GCATCAGGTT 
TATACTTATC CGGCACCATA A

Protein sequence

MQYHRIPHSS LEVSTLGLGT MTFGEQNSEA DAHAQLDYAV AQGINLIDVA EMYPVPPRPE 
TQGLTETYVG NWLAKHGSRE KLIIASKVSG PSRNNDKGIR PDQALDRKNI REALHDSLKR 
LQTDYLDLYQ VHWPQRPTNC FGKLGYSWTD SAPAVSLLDT LDALAEYQRA GKIRYIGVSN 
ETAFGVMRYL HLADKHDLPS IVTIQNPYSL LNRSFEVGLA EVSQYEGGEL LAYSCLGFGT 
LTGKYLNGAK PAGARNTLFS RFTRYSGEQT QKAVAAYVDI ARRHGLDPAQ MALAFVRRQP 
FVASTLLGAT TMDQLKTNIE SLHLELSEDV LAEIEAVHQV YTYPAP