Gene TM1040_1191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1191
Symbol
ID	4077800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1281161
End bp	1282156
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	61%
IMG OID	638006497
Product	aldo/keto reductase
Protein accession	YP_613186
Protein GI	99081032
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0223212
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCATG AAATGCTGAA ACGTGAGATC GGCCGCTCCG GGATCGAGGC TTCGGCCATC 
GGGCTTGGCA CCTGGGCCAT TGGCGGCTGG ATGTGGGGTG GCACGGATGA GGCGCGCTCG 
ATCGCCGCTA TTCAGGCCTC GATTGAGGCC GGAGTGAGCC TCATCGACAC CGCGCCCGCC 
TATGGTCAGG GCGTCGCCGA GGAGATCGTC GGCAAGGCCA TCAAGGACCG TCGCGACAAG 
GTGGTGCTGG CCACGAAATG CGGGCTCGTC TGGCACACGC AAAAGGGCAA TCACTTCTTT 
GATTACGACG GCGCGCCGGT GCATCGCTAT CTTGGCAAGG ATGCGATCAT CTATGAGGTC 
GAACAAAGCC TCACGCGTCT CGGCACCGAT TACATCGATC ACTACATCAC CCATTGGCAG 
GATCCCACGA CGCCGATTGC CGAAACGATG GAGGCGCTGG AGCAGCTGAA AACACAGGGC 
AAAATCCGCT CGATTGGTGC CAGCAATACC ACGCCTTTGG ACGTGCGTGC CTATCTCGAG 
GCGGGACAGC TTGATGCGGT TCAAGAAGAA TATTCGATGG TGAACCGCGC GGTTGAGGCC 
GAGATGGCGC CGCTCTGTCA TGAAAACGGG GTGTCCATCC TCAGCTATTC CTCGCTCGCG 
CTGGGGCTTC TGACCGGCAA GATCGGCCCC GACCGGGTGT TTGAAGGCGA CGATCAGCGC 
AAGGACAACC CACGGTTTTC AATTGCCAAT CGCGAAAAAG TGGCCCGCTT GATGGAGGCC 
ATCGCGCACA TTGCCGAAGT ACACGGTGCC ACCAAGGCCC AGGTGGTGAT CGCCTGGACG 
CTGCAGCAGC CGGGGATAAC CTTCTCGCTC TGCGGGGCGC GCGATGCGAC ACAAGCAGTT 
GAAAACGCCA AGGCGGGTCT GCTGCGTCTC AGCGCGGATG ACATTGCCCG GATAAGCGGT 
GCCGCCAGCA CGCATCTCAG CGACCTCGAC GGCTGA

Protein sequence

MSHEMLKREI GRSGIEASAI GLGTWAIGGW MWGGTDEARS IAAIQASIEA GVSLIDTAPA 
YGQGVAEEIV GKAIKDRRDK VVLATKCGLV WHTQKGNHFF DYDGAPVHRY LGKDAIIYEV 
EQSLTRLGTD YIDHYITHWQ DPTTPIAETM EALEQLKTQG KIRSIGASNT TPLDVRAYLE 
AGQLDAVQEE YSMVNRAVEA EMAPLCHENG VSILSYSSLA LGLLTGKIGP DRVFEGDDQR 
KDNPRFSIAN REKVARLMEA IAHIAEVHGA TKAQVVIAWT LQQPGITFSL CGARDATQAV 
ENAKAGLLRL SADDIARISG AASTHLSDLD G