Gene Achl_0139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_0139
Symbol
ID	7291565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	+
Start bp	151164
End bp	152519
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	62%
IMG OID	643588538
Product	Aldehyde Dehydrogenase
Protein accession	YP_002486231
Protein GI	220910922
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	97
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCAT TTGCCGTTAT TGATCCGGCT ACAGGAACCA TCCACGCCGA GTATCCCGCA 
GCCACTGACG CAGAGGTGGA AGCCGGACTC GCTGCAGCGC AGAACACCTA CCATGAATGG 
TCCCGCACCA CTACGGTGGC CGAACGCGCG GGCATGGCCA GGCGCCTTGC CGAGCTGTTC 
GTTGAACGCA AGGACAAGCT GGCCGCCATC ATCAACCGGG AAATGGGTAA GCCCCTCCAG 
CAAGCGGCCG GCGAAGCAGA GTTCTCGGGC TCCATCGCTT CGGCCTTCGC CGAAAACGCC 
GAGGAGTGGC TGGCAGATGA GCAACTCGAG GTCGCTGACG GTTTGCGGAG CTTCTTCCGC 
TACCAGGGCC TCGGCGTGAT CCTGGGCATC ATGCCGTGGA ACTACCCCTA CTATCAGGTG 
GCACGGTTCG CGATTCCCAA CATCATCCTT GGCAACACCG TCATTGTGCG GCACGCCAGC 
CAGTGCCCGG AATCGGCGTT GGCCCTGGAG GAACTCTTCC GCGATGCAGG CTTCCCCGAG 
GGCGCCTACG TCAACCTGTT CGCTACCCAC CAGCAGATCT CCAACATCAT TGCCGACGAC 
CGGGTGCAGG GTGTGTCGCT GACGGGCTCA GAGCAAGTGG GCGCAATCGT GGCTGAACAG 
GCCGGGCGCG CGCTGAAAAA GTGTGTCCTG GAGCTCGGCG GCGCCGACGT GTTCCTCGTT 
CTGGACACTG ACGATGTGGA CCTCGCTGTG AAGAAGGCCG TCATGGGTCG CATGGGCAAC 
ACGGGCCAGT CCTGCAACGG TTCCAAGAGG ATCGTGGTGC TGGATAAGTA CTTCGATGAG 
TTTTCGGAGA AGTTCAAGGC TGCCATCGCC GGACAGTCCT ACGAGAACGG CGATTTCGGA 
CCGATGTCTT CGGACTCGGC CACCAAGTTC CTGGCTTCCC AGGTGCAGGG TGCGCTGGAC 
CAGGGTGCGG AAATTCTGGT GGGCAACAAC CAGCCCCAGG GCAACGTCTT CACTCCGACA 
ATCATCACCA ACATCACGCC GTCCATGGAC GTCTACAGCG AGGAACTCTT CGGCCCCGTT 
GCGCAGCTGT ACAAAGTCAG CAGCGACGCC GAGGCGATCA ATCTTGCCAA CTCCTCGCCG 
TACGGCCTGG GTTCCGTAGT GATCTGCGAC GACGTCGAGC GCGCCGAGCG CGTCGGCAAC 
CAGCTCGACG TCGGCATGGT ATTCGTCGGT GCCTACGACC TCAGCGGTGC GGACGTGCCG 
TTCGGCGGCG TCAAGAAGTC CGGCTACGGA CGCGAACTGG GCAAGGTGGG CATGCTGGAA 
TTCGCCAACA AGAAGCTGTT CCGCTTCGCC AAATAA

Protein sequence

MSAFAVIDPA TGTIHAEYPA ATDAEVEAGL AAAQNTYHEW SRTTTVAERA GMARRLAELF 
VERKDKLAAI INREMGKPLQ QAAGEAEFSG SIASAFAENA EEWLADEQLE VADGLRSFFR 
YQGLGVILGI MPWNYPYYQV ARFAIPNIIL GNTVIVRHAS QCPESALALE ELFRDAGFPE 
GAYVNLFATH QQISNIIADD RVQGVSLTGS EQVGAIVAEQ AGRALKKCVL ELGGADVFLV 
LDTDDVDLAV KKAVMGRMGN TGQSCNGSKR IVVLDKYFDE FSEKFKAAIA GQSYENGDFG 
PMSSDSATKF LASQVQGALD QGAEILVGNN QPQGNVFTPT IITNITPSMD VYSEELFGPV 
AQLYKVSSDA EAINLANSSP YGLGSVVICD DVERAERVGN QLDVGMVFVG AYDLSGADVP 
FGGVKKSGYG RELGKVGMLE FANKKLFRFA K