Gene TM1040_2190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2190
Symbol
ID	4078181
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2299874
End bp	2300920
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	59%
IMG OID	638007512
Product	aldo/keto reductase
Protein accession	YP_614184
Protein GI	99082030
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.888803
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAAGA ACCGGCTTGG CCGCACAGAT ATGATGGTGA CCGATCTGTG CCTTGGGACC 
ATGACCTATG GCACTCAGAC CGATGAAGCG GATGCGCATG CGCAGATCGA CATGGCGCTG 
GAAGCGGGGA TCAACTTCCT CGATACCGCT GAGATGTATC CAGTGAACCC CATTCGGGCG 
GAGACCCTTG GTCTGAGCGA AGAGATCATC GGCAACTGGA ACCAAAAGAC CGGCCGCCGG 
AAGGACTATA TCCTTGCGAC AAAACACTCA GGCGAGGGCT CCGTGGCGCG CGACGGGGCG 
CCGATCACAG GCAAAACCAT TGCGGCGACC GTTGAGGCAT CGTTGAAGCG GCTCAAGACC 
GACTACATCG ACCTTTATCA GTTTCACTGG CCAAACCGCG GCAGCTACAT GTTCCGCAAG 
AACTGGAGTT ATGATCCGAC CGCTTCTTCT TATAATCGCG CGCAGGTGAT CGCGGATATG 
GAAGAATGCC TCGCCGCGTT GCAGGCGCAA GTCGAAAAGG GCAACATCCG CGCCTTTGGG 
CTTTCCAATG AAAGCGCCTG GGGCACTGCG CAATGGCTGC GTCTGGCGGA AGAGGGCAAG 
GGCCCGCGGG TTGCCTCGAT CCAGAACGAA TACTCTTTGC TGTGCAGGCT TTATGACACG 
GACCTGGCAG AGCTGAGCCA CTATGAGGAT GTTGGCTTGC TGTCGTTCTC TCCTTTGGGG 
GCCGGGTATC TCACCGGGAA ATATCAAGAG GGTGCGGTGC CGGAAAAGTC GCGCAAGTCG 
ATCAACCCGG AGATGGGCGG GCGGCAGTCT GATCGGGTAG AGGCGGCCGT CGCGGCCTAC 
CTGACGATCG CGGCCGATCA TGGGCTGGAT CCGGTGCATA TGGCGCTGGG GTGGTGCCGG 
ACACGGCCGT TTATGGCTTC GGCGATCTTT GGTGCGACCG ATGTGGCGCA GCTCGCGCAT 
ATCCTTGAAG GTGCGGATCT TGAACTGGCG CCCGAAGTTC TGGCTCAGAT CGATCAGGCC 
CATCGCGCCC ATGCGATGCC GTACTGA

Protein sequence

MKKNRLGRTD MMVTDLCLGT MTYGTQTDEA DAHAQIDMAL EAGINFLDTA EMYPVNPIRA 
ETLGLSEEII GNWNQKTGRR KDYILATKHS GEGSVARDGA PITGKTIAAT VEASLKRLKT 
DYIDLYQFHW PNRGSYMFRK NWSYDPTASS YNRAQVIADM EECLAALQAQ VEKGNIRAFG 
LSNESAWGTA QWLRLAEEGK GPRVASIQNE YSLLCRLYDT DLAELSHYED VGLLSFSPLG 
AGYLTGKYQE GAVPEKSRKS INPEMGGRQS DRVEAAVAAY LTIAADHGLD PVHMALGWCR 
TRPFMASAIF GATDVAQLAH ILEGADLELA PEVLAQIDQA HRAHAMPY