Gene Arth_1723 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1723
Symbol
ID	4445762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	1924936
End bp	1926315
Gene Length	1380 bp
Protein Length	459 aa
Translation table	11
GC content	67%
IMG OID	639689545
Product	aldehyde dehydrogenase
Protein accession	YP_831217
Protein GI	116670284
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0635196
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGCAG CCCAGTACGA GGTCCATGAC CCGGCCACCT TTGAGCTCGT TGGACACGCT 
CCGGAAAACA CAGCGGAGGA CGTTGAGTTC GCGGTTGCGT CCGCCCGTGC CGCCGCACTT 
GGCTGGGCCG CGGACAGGGA AGCGCGCCGC AACGCCCTGC GCGCAGGTGC CGCACTGATC 
CGCCGCGACC TGGACGAGCT GGCCACCCTG CTCTCCCTGG AACAGGGCAA GCCCAAGGCC 
GACGCCGCAG GTGAGTTCTC GGTGGCCGCC AACCTTTTCG AATACTATGC GGACCTCGAC 
TGGGACGAAG CCCAGCAACT CACCCCGCGG GCCGACCGCA GCCTGGAGGT CCAGTACCGG 
CCTGTGGGAA TCGTCGGCAC CATCACCCCG TGGAACTTCC CCATCTCCCT GCTCGGCGTA 
AAACTCGCCC CTGCCCTGGT GGCCGGCTGC ACCGTGATCG CCAAACCCTC GCCGTCCACA 
CCCCTGTCCA CGATTGCCCT GATTAACCTG CTCAACGAGG TCCTCCCGGC CGGTGTGCTG 
CAGGCCCGCA CCAGTTCGCG GCGGACGGTA AACGTTGCCC TGAGCACCTC ACCTGGCATC 
CGCAAGATCT CCTTTACGGG TTCCACGGAG GTGGGCATCT CCGTCGCCCA GCAGGCTGCT 
TCAACCGTCA AGCGCGTCAC CATGGAACTG GGCGGTAACG ATCCTGCTAT CGTCCTGGAC 
GACGCGGACA TCGCTGTCAC CGCCCGCGGT ATTGTGGGCA GCGCCTTCCG CAACGCCGGC 
CAGGTCTGCA TGGCGGTCAA GCGCGTGTAC GTCCCGCGCA GCCGCGGCGC GGAACTGGCT 
GAGGCCATAG CCGCCGAGGC GGCCCGCTAT GTGCTGGGCC ACGGCATCGC TGACGGCACC 
ACCATGGGCC CGATGCACAA CGAGTCCCAG CTCAAGCTGA TCCACGGCCT GGTTGAATCC 
GCGGTGGGCG CCGGCGCCCG CATCCTCACC GGCGGCACCC CCGGCTGCGA CCTGCCCGGC 
TACTTCCTCT CCCCCACTGT AGTGATCGAC GCCGAGCCGG GCATGGACCT TGTCGAACAG 
GAACAGTTCG GGGCAGCACT GCCCATCGTG GCCTACGACA ACCTCGACGA AACCATCGCC 
GGAATTAACG CCGGAGAGTT CGGCCTGGGC GCATCCGTCT GGAGCCCCGA CCAGGAACGG 
GCCTACGCCA CCGCCTCACG CATTGAGGCC GGAACCGTCT GGGTCAACCA GCACACCCTG 
GTGGAACCGG ACGCCCCGTT CGGCGGCTGG AAGGCTTCCG GCGTCGGCCG CGAACGCGGC 
CGCTGGGGCC TGGAGGAATA CCTGGAAACC CGCGTCATCA ATGCCCGTCC CCACTCCTGA

Protein sequence

MTAAQYEVHD PATFELVGHA PENTAEDVEF AVASARAAAL GWAADREARR NALRAGAALI 
RRDLDELATL LSLEQGKPKA DAAGEFSVAA NLFEYYADLD WDEAQQLTPR ADRSLEVQYR 
PVGIVGTITP WNFPISLLGV KLAPALVAGC TVIAKPSPST PLSTIALINL LNEVLPAGVL 
QARTSSRRTV NVALSTSPGI RKISFTGSTE VGISVAQQAA STVKRVTMEL GGNDPAIVLD 
DADIAVTARG IVGSAFRNAG QVCMAVKRVY VPRSRGAELA EAIAAEAARY VLGHGIADGT 
TMGPMHNESQ LKLIHGLVES AVGAGARILT GGTPGCDLPG YFLSPTVVID AEPGMDLVEQ 
EQFGAALPIV AYDNLDETIA GINAGEFGLG ASVWSPDQER AYATASRIEA GTVWVNQHTL 
VEPDAPFGGW KASGVGRERG RWGLEEYLET RVINARPHS