Gene TM1040_3381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3381
Symbol
ID	4075280
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	396121
End bp	397569
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	59%
IMG OID	638004889
Product	aldehyde dehydrogenase
Protein accession	YP_611615
Protein GI	99078357
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.464458
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGATA TTCAAAAGAA CCTGATCGCT GGCGAATGGC TGACCGGCGA AGGCGAAATC 
GAAAATCGCA ACCCTTCGGA CCTTTCGGAT CTGGTCGGGA TCTTCGCTCA GGCCAGCAGC 
GACCAGCTTG AGGCCACCCT AGATCAAGCA AAGGTCGCAC AACGCGAGTG GGCTGCCTAT 
GGTCTCGAAC GCAAGCAGGC GGTCTTGATG GCCATCGGCA ATGAGTTGAT CGCCCGTTCT 
GAGGAGCTTG GCACGCTGTT GTCGCGCGAA GAGGGCAAAC CTTTCGCTGA GGGCAAGGGC 
GAAGTCTACC GTGCCGGTCA GTTCTTCACC TATTACGCCG CCGAATGCCT GCGCCAGATT 
GGCGAGAACG CTGACTCGGT GCGTCCTGAC ATCGAAATCG ACGTGCGCCG CGAGGCCGTG 
GGCACGGTCG CCATCATCAG CCCTTGGAAT TTTCCGACCG CCACCGCCTC GTGGAAAATT 
GCGCCCGCTC TGTGCTACGG CAACGCAGTC GTGTGGAAAC CTGCCAATGT GACGCCTGCC 
TCGGCGGTTG CGCTGGCAGA AATCATCAAC CGCCAAGACA TCCCCAAAGG GCTGTTCAGC 
CTTGTGATGG GTGCGGGTCG CACCGTAGGT CAGCGCCTGG TCGAGAGCCC GAAAGTCAAT 
GCGATTTCCT TTACTGGTTC AGTGCCAGTC GGCAAAGGCA TTGCCGCAGC GGCAATCCAG 
AATCTGACTA AAGTACAGAT GGAGATGGGC TCGAAGAATG CGTTGGCCGT GATGGACGAC 
GCGGATCTGA ACCTCGCGGT GAGCCTTGCT CTGGGTGGCG CTTTTGGCGG CACGGGTCAG 
AAATGCACCG CGTCCTCTCG GCTTGTCGTC CACGCTGCAG TGCATGATGC CTTTGTTGAA 
AAGCTGGTCG CCGGCGCACA AGCGATGAAG GTGGGCCACG CGTTGCATGA CGGCACACAG 
ATGGGACCAG TGGTGAGCGC ACAGCAGCTC GAGGAAAACC TCGCCTATGT GGATCTGGGC 
CGTTCAGAAG GGGCAGAACT GGCCTGTGGA GGAACGCGAT TGGAGATGCC GCACGACGGT 
TTTTACATGT CGCCAGGCGT ATTTCTGAAC ACCAGCAACG ATATGCGCAT CAACCGCGAG 
GAGATGTTTG CGCCGCTGAC CTCTGTAATC AAGGTCGACA GCTATGATGA AGCGCTGGCA 
ACGGTGAACG ACACCAACTT TGGCCTGACC TCAGGCATTG TGACCAAATC GCTCGCCCGC 
GCCACGCATT TCCGTCGCAA CGCACAGACT GGCGTTGTCA CCGTGAATCT GCCGACCGCG 
GGCACCGATT ACCACGTTCC CTTTGGTGGG CGCGGCGACA GCTCTTACGG CCCACGCGAG 
CAAGGCAAGG CCGCGGCAGA ATTCTACACA ACGGTCAAGA CGGCCTACAT CAGCGCAGGC 
CCCGTCTGA

Protein sequence

MTDIQKNLIA GEWLTGEGEI ENRNPSDLSD LVGIFAQASS DQLEATLDQA KVAQREWAAY 
GLERKQAVLM AIGNELIARS EELGTLLSRE EGKPFAEGKG EVYRAGQFFT YYAAECLRQI 
GENADSVRPD IEIDVRREAV GTVAIISPWN FPTATASWKI APALCYGNAV VWKPANVTPA 
SAVALAEIIN RQDIPKGLFS LVMGAGRTVG QRLVESPKVN AISFTGSVPV GKGIAAAAIQ 
NLTKVQMEMG SKNALAVMDD ADLNLAVSLA LGGAFGGTGQ KCTASSRLVV HAAVHDAFVE 
KLVAGAQAMK VGHALHDGTQ MGPVVSAQQL EENLAYVDLG RSEGAELACG GTRLEMPHDG 
FYMSPGVFLN TSNDMRINRE EMFAPLTSVI KVDSYDEALA TVNDTNFGLT SGIVTKSLAR 
ATHFRRNAQT GVVTVNLPTA GTDYHVPFGG RGDSSYGPRE QGKAAAEFYT TVKTAYISAG 
PV