Gene Arth_3744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3744
Symbol
ID	4443757
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4218992
End bp	4220515
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	67%
IMG OID	639691568
Product	aldehyde dehydrogenase (acceptor)
Protein accession	YP_833219
Protein GI	116672286
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACCG CAACGCTATT CATCGGCGGC ACCTGGAGTG CAGCGTCCGA CGGCGGCACC 
CGTGAGATCC GCTGTCCGGC CGACGGCGAA CTGGCCGGCG TCGTCTCCGA GGCCAACGCC 
TACGACGCTG TCCGCGCCGT GGCAGCCGCC AGGGCGGCGT TCGACGGCGG CGAATGGGCA 
GGTGTCCCGG CCTTGGAACG CGGGTCCTTC CTGCTGCGCG TCGCGGCGAG GTTGCGGGAG 
CGCAAGGACG AGTTTGCCCG CGCCGAAACG CTGGACACCG GCAAGCGCCT GGTGGAGAGC 
GAAATCGACA TGGACGACAT CGCCAACTGC TTCGAGTACT TCGGCAAAAT CGCGGGCCAG 
GACTCCGGAC GGCTGGTCGA CGCGGGCAGC AGCACCGTGG TCAGCCGGAT CGAATACGAA 
CCCGTAGGCG TCTGTGCGCT GATCGCCCCC TGGAACTACC CGCTGCTGCA GGCCGCCTGG 
AAGATCGCCC CGGCGCTCGC GGCAGGCTGC AGCTTCGTGC TCAAGCCGAG CGAACTGACG 
CCCCACACCG CCATCCTGAT GATGCAGGTC CTGGAAGAAC TGGGACTGCC GTGCGGGGTC 
GCCAACCTTG TCCTGGGCGA CGGGAAAACC GTGGGTTCAG TGCTTTCCGG AAACCCGGAT 
GTTGACCTCG TCTCCTTCAC GGGCGGGCTC GAAACCGGCA AGACCATCGC AGCTTCGGCC 
GCCGCCACGG TCAAGAAGGT AGCGCTGGAG CTGGGCGGCA AGAACCCCAA CATCATCTTC 
GCTGACGCCG ACTTCGACGC CGCCCTGGAC AACGCGCTCA ACGCCGCCTT CGTGCACTCC 
GGCCAGGTCT GCTCCGCCGG CTCGCGCCTG ATTGTCGAGG AATCCATTGC CGAACGGTTC 
GTGGACGAGC TGGTCCGCCG TGCGGAGCAG ATCCGCCTGG GCGGCCCCTT CGATCCCGAC 
GCCGAGACAG GGCCGCTGAT CTCCGCAGCC CACCGCGACA AGGTGACCGC CTACGTGGAC 
AAGGGCGTCG CCGAGGGTGC ACGCCTGCGC TGCGGCGGTA CGTGGGGCGA CGGCGAGCTC 
AAAAAGGGCT ACTACTACCT GCCCACCGTC CTGGACCAGG TCACCAGCGG CATGTCCGTG 
CTGAAGGATG AGGCTTTCGG TCCGGTGGTC ACCGTGGAAA CCTTCAGCAC CGAAGAAGAA 
GCCGTGCGGC TGGGCAATGA CACCCACTAC GGCCTGGCCG GCGCCGTCTG GAGCCAGAAT 
GCCGGCAAGA GCCAACGCGT GGCCCGCAAG CTGCGCCACG GCACCATCTG GATCAACGAT 
TTCCACCCCT ACCTGCCGCA GGCGGAATGG GGCGGCTTCG GCCAGTCCGG CGTCGGGCGC 
GAACTCGGAC CCACGGGCCT GGCTGAATAC CAGGAAGCCA AGCACGTCTA TCACAACATC 
GATCCGCAGG TGACGGGCTG GTTCGCGGAC CCTGGCACAG CCGGGAACAC AGCCGGGAAC 
ACAGTCACCG CAGAGGGGAA CTAA

Protein sequence

MTTATLFIGG TWSAASDGGT REIRCPADGE LAGVVSEANA YDAVRAVAAA RAAFDGGEWA 
GVPALERGSF LLRVAARLRE RKDEFARAET LDTGKRLVES EIDMDDIANC FEYFGKIAGQ 
DSGRLVDAGS STVVSRIEYE PVGVCALIAP WNYPLLQAAW KIAPALAAGC SFVLKPSELT 
PHTAILMMQV LEELGLPCGV ANLVLGDGKT VGSVLSGNPD VDLVSFTGGL ETGKTIAASA 
AATVKKVALE LGGKNPNIIF ADADFDAALD NALNAAFVHS GQVCSAGSRL IVEESIAERF 
VDELVRRAEQ IRLGGPFDPD AETGPLISAA HRDKVTAYVD KGVAEGARLR CGGTWGDGEL 
KKGYYYLPTV LDQVTSGMSV LKDEAFGPVV TVETFSTEEE AVRLGNDTHY GLAGAVWSQN 
AGKSQRVARK LRHGTIWIND FHPYLPQAEW GGFGQSGVGR ELGPTGLAEY QEAKHVYHNI 
DPQVTGWFAD PGTAGNTAGN TVTAEGN