Gene Daro_3806 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3806
Symbol
ID	3567962
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	4088331
End bp	4089800
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	63%
IMG OID	637682280
Product	aldehyde dehydrogenase
Protein accession	YP_287004
Protein GI	71909417
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR03216] 2-hydroxymuconic semialdehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00657404
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCCAAC CGCAAAGAAT CCACCATTTC ATCAACGGCG AATTCACCGC TTCGCCCGAT 
CCCCGCTATT TCGACAAGCG TTCGCCGGTT GACGGCCGCG TCATCGCCCA CATCGCCGAA 
GCCGGCCAGG CCGATGTCGA TGCCGCCGTC ACCGCTGCCC GTGCTGCGCT GAAGGGTGAA 
TGGGGCAAGC TGAGCACCGA CCAGCGCGTC GACCTGCTCT ATGGTGTGGC CAACGAAATC 
ACCCGCCGCT TCGATGATTT CGTCGCTGCC GAAATGGCCG ATACCGGCCA GCCCTCGCAC 
GTCCAGACGC ATGTCTTCAT TCCGCGCGGC GCGGCCAACT TCAAGGTGTT CGCCGACGTG 
ATCAAGAACG TTGCCGCCGA ATCCTTCCGC ATGGCGACGC CAGACGGTAA GGGCGCACTG 
AACTACGCGA TCCGTAATCC GAAGGGCGTG ATCGGCGTTA TCTCGCCGTG GAATGCGCCC 
TTCCTGCTGA TGACCTGGAA GGTTGGCCCG GCACTAGCCT GTGGCAACAC CGTGGTGGTC 
AAGCCTTCAG AGGAAACCCC GCTGACCGCC ACGCTGCTCG GCGAGGTGAT GAACAGCGTC 
GGCATTCCCA AGGGCGTCTA TAACGTGATC AACGGCTTCG GCCCCGATTC GGCCGGCGCT 
TACCTGACCC AGCATCCGGG CGTCGATGCC ATCACCTTCA CCGGCGAAAC TCGCACCGGC 
ACGGCGATCA TGAAGGCCGC CGCCGAAGGC ATGCGCGACG TGTCCTTCGA ACTGGGCGGC 
AAGAATGCCG GCATCGTTTT CGCCGACTGC AATTTCGAGG CAGCGGTCGA TGGCATCTTC 
CGCTCCGCCT TCCTCAACAC CGGGCAGGTC TGCCTGGGCA CCGAGCGCGT CTATGTCGAG 
CGGCCGATAT TCGAAAACTT CGTGCAGGCG CTGAAGGCGA AGGTCGAAGG TGTGCGCTAT 
GGCCGCCCGG AAGACCACAC CAGCACTTAC GGCCCGCTGA TCAGCCAGGA ACACCGCGAC 
AAGGTACTGT CGTATTACAA GAAAGCAGTC GACGAAGGGG CGACAGTCGT CACCGGCGGC 
GGCGTGCCCG ACATGCCGGC CGAGCTGGCC GGTGGCAGTT GGGTGCAGCC GACCATCTGG 
ACTGGCTTGC CGGAAACCGC CGCCGTGGTG CGCGAGGAAA TCTTCGGCCC GTGCTGCCAC 
ATCCGCCCCT TCGACAGCGA AGAAGAAGTG ATCGAACTCG CCAACGCCAA CGACTACGGC 
CTGGCGACCA CGATCTGGAC CGAGAACCTG TCGCGCGCCC ATCGCGTCGC CGAGCGCGTC 
GAAGTCGGCG TCACCTGGGT GAACAGCTGG TTCCTGCGCG ACCTGCGCAC GCCCTTCGGC 
GGCTCAAAGC AGTCCGGCAT CGGCCGCGAA GGCGGTGTCC ATTCGCTCGA GTTCTATACC 
GAAACCCGCA ACGTCTGCAT CAAGCTCTAA

Protein sequence

MSQPQRIHHF INGEFTASPD PRYFDKRSPV DGRVIAHIAE AGQADVDAAV TAARAALKGE 
WGKLSTDQRV DLLYGVANEI TRRFDDFVAA EMADTGQPSH VQTHVFIPRG AANFKVFADV 
IKNVAAESFR MATPDGKGAL NYAIRNPKGV IGVISPWNAP FLLMTWKVGP ALACGNTVVV 
KPSEETPLTA TLLGEVMNSV GIPKGVYNVI NGFGPDSAGA YLTQHPGVDA ITFTGETRTG 
TAIMKAAAEG MRDVSFELGG KNAGIVFADC NFEAAVDGIF RSAFLNTGQV CLGTERVYVE 
RPIFENFVQA LKAKVEGVRY GRPEDHTSTY GPLISQEHRD KVLSYYKKAV DEGATVVTGG 
GVPDMPAELA GGSWVQPTIW TGLPETAAVV REEIFGPCCH IRPFDSEEEV IELANANDYG 
LATTIWTENL SRAHRVAERV EVGVTWVNSW FLRDLRTPFG GSKQSGIGRE GGVHSLEFYT 
ETRNVCIKL