Gene TM1040_0040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0040
Symbol
ID	4076307
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	42535
End bp	43575
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	60%
IMG OID	638005327
Product	alcohol dehydrogenase GroES-like protein
Protein accession	YP_612035
Protein GI	99079881
COG category	[R] General function prediction only
COG ID	[COG1064] Zn-dependent alcohol dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.992723
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.309585
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCCG TCCTCTATGA GACCTTTAAG GAGTTGCCAA AACTGGTCAC GGTCGAGGAT 
CCCACCCCGG ATCCGGATGG CGTGGTGATC AAGGTCGAGG CCACCGGGCT CTGCCGCTCA 
GACTGGCATG GCTGGATGGG GCATGACAGC GACATCGTGC TACCGCATGT GCCCGGCCAT 
GAATTTGCAG GTGTGATTGT GGCCTTGGGG AAGAATGTCC GCAACTGGAC GGTTGGGGAT 
CGCGTGACCG TGCCATTCAT CTCTGGATGC GGAGCCTGTT CGGAGTGTCA CGCCGGCCAC 
CAGCAGGTTT GCCACAACCA GCAACAGCCT GGATTTACCC ATTGGGGGTC TTTTGCGGAA 
TATGTGGGGG TCCGTCAGGC CGATCTGAAC CTCGTGGCGC TGCCACAGGA AATGGATTTT 
GCCACCGCAG CAAGTCTTGG GTGCCGCTTT GCCACCTCCT TTCGCGCAGT GGTCGATCAG 
GCCCAAACGC GGGCCGGACA ATGGGTTGCG GTGCATGGAT GCGGTGGCGT GGGATTGTCT 
GCGGTGATGA TTGCTCAGGC GGTTGGCGCC AATGTGATCG CCATTGATAT CGACGACGAA 
AAACTCAATC TCGCCCAAGA ACTCGGAGCC GTTGCGACTA TCAATGGTGC GCGCGTGGCC 
GATGTCCCAG AGGCGGTGAT CGACCTCAGC AGAGGCGGCG CGCATGTCTC GCTGGATGCA 
CTGGGCCACC CGTTGACCTG CTTCAACTCG ATCCAGAACC TGCGCCCTCG CGGCAAACAC 
GTGCAGGTGG GCTTGATGCT CGCAGAGCAC AGCACGCCGT CGGTGCCGAT GGCGAAAGTC 
ATTGCAAAAG AGTTGGAGAT CCTCGGATCC CACGGCATGC AAGCGCATCG GTACGACGCC 
ATGCTGGATA TGATCGCATC CGGAAAACTT GATCCCAGGC GGCTTGTGGG GCGTGAAATC 
AGCCTCGATG CGGCCCCCTC CGCCCTTGTG AAGATGGATC AGTTCCAATC GATCGGCGCG 
ACGGTTATCA CCACCTTCTG A

Protein sequence

MKAVLYETFK ELPKLVTVED PTPDPDGVVI KVEATGLCRS DWHGWMGHDS DIVLPHVPGH 
EFAGVIVALG KNVRNWTVGD RVTVPFISGC GACSECHAGH QQVCHNQQQP GFTHWGSFAE 
YVGVRQADLN LVALPQEMDF ATAASLGCRF ATSFRAVVDQ AQTRAGQWVA VHGCGGVGLS 
AVMIAQAVGA NVIAIDIDDE KLNLAQELGA VATINGARVA DVPEAVIDLS RGGAHVSLDA 
LGHPLTCFNS IQNLRPRGKH VQVGLMLAEH STPSVPMAKV IAKELEILGS HGMQAHRYDA 
MLDMIASGKL DPRRLVGREI SLDAAPSALV KMDQFQSIGA TVITTF