Gene Arth_3088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3088
Symbol
ID	4444321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3459028
End bp	3460551
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	65%
IMG OID	639690915
Product	aldehyde dehydrogenase
Protein accession	YP_832567
Protein GI	116671634
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGTCT ACGCACAGCC CGGTACCGAA GGTTCGAAGG TTACGTTCAA GGACCGCTAC 
GAGAACTGGA TCGGCGGCGA ATGGGTGGCT CCCGTCAAGG GCCAGTACTT CGAGAACATC 
ACCCCGGTCA CCGGCAAGGC ATTCTGCGAG GTGGCCCGCG GCACGGCCGA AGACATCGAG 
CTGGCCCTGG ACGCCGCGCA CAAGATCGCA CCCTCGTGGG GCAAGACCTC CGTTGCCGAG 
CGCGCAGCCA TCCTGAACAA GATCGCCGAC CGCATCGACG AGAACCTCGA GATGCTCGCC 
GTGGCCGAGT CCTGGGACAA CGGCAAGCCG ATCCGCGAAA CCCTCAACGC GGACATTCCG 
CTGGCTGCCG ACCACTTCCG CTACTTCGCC TCCGCGGTCC GCGCCCAGGA AGGCCGCCTG 
TCACAGCTTG ACGATGACAC CACGGCCTAC CACTACCACG AGCCGCTCGG CGTCGTGGGC 
CAGATCATTC CGTGGAACTT CCCCATCCTC ATGGCCGTCT GGAAGCTCGC CCCGGCCCTG 
GCCGCCGGCA ACGCCGTGGT CCTCAAGCCG GCCGAGCAGA CGCCGTCGTC CATCCTGGTC 
CTGATGGAGC TCATCGGCGA CATCCTTCCC GCCGGTGTCA TCAACGTGGT CAACGGCTTC 
GGCGTCGAAG CCGGCAAGCC GCTGGCCTCC AGCCCCCGGA TCCGCAAGAT CGCGTTCACC 
GGTGAAACCA CCACCGGCCG CCTGATCAGC CAGTACGCCA GCCAGAACCT GATCCCGGTC 
ACCCTCGAGC TGGGCGGCAA GAGCCCGAAC ATCTTCTTCA ACGACGTTGC CGACAAGGAC 
GACGCGTTCT ACGACAAGGC GCAGGAGGGC TTCGCGCTGT TTGCGTTCAA CCAGGGCGAA 
GTCTGCACCT GCCCGTCCCG CGCCCTGGTC CAGGAGGACA TCTACGACTC CTTCATGGCC 
GATGCCGTGG CGCGCGTGGA GAAGATGATC CAGGGCAACC CGCTGGACAC CGAAACCCAG 
GTGGGCGCCC AGGCCTCCAA TGACCAGCTC GAGAAGATCC TCTCCTACAT CGACATCGGA 
AAGCAGGAGG GTGCCAAGGT GCTCACCGGC GGCGCCCGCG CCGAGCTTCC CGGCGACCTG 
GCCGGCGGCT TCTACGTCCA GCCCACCGTC TTCGAAGGCC ACAACAAGAT GCGGATCTTC 
CAGGAGGAGA TCTTCGGTCC GGTGGTGTCC GTGACGCGCT TCAGCGACTA CAACGACGCC 
ATGGGCATCG CCAACGACAC CCTCTACGGC CTCGGCGCCG GCGTCTGGTC CCGCAACGGC 
AACGTGGCGT ACCGCGCCGG GCGTGAAATC CAGGCGGGCC GTGTCTGGGT CAACAACTAC 
CACGCCTACC CGGCCGGTGC CGCGTTCGGC GGCTACAAGT CCTCCGGCAT CGGACGTGAG 
AACCACTCCA TGATGCTGGA CCACTACCAG CAGACCAAGA ACCTCCTGGT CAGCTACAAC 
GAAAACAAAC TCGGCTTCTT CTAA

Protein sequence

MTVYAQPGTE GSKVTFKDRY ENWIGGEWVA PVKGQYFENI TPVTGKAFCE VARGTAEDIE 
LALDAAHKIA PSWGKTSVAE RAAILNKIAD RIDENLEMLA VAESWDNGKP IRETLNADIP 
LAADHFRYFA SAVRAQEGRL SQLDDDTTAY HYHEPLGVVG QIIPWNFPIL MAVWKLAPAL 
AAGNAVVLKP AEQTPSSILV LMELIGDILP AGVINVVNGF GVEAGKPLAS SPRIRKIAFT 
GETTTGRLIS QYASQNLIPV TLELGGKSPN IFFNDVADKD DAFYDKAQEG FALFAFNQGE 
VCTCPSRALV QEDIYDSFMA DAVARVEKMI QGNPLDTETQ VGAQASNDQL EKILSYIDIG 
KQEGAKVLTG GARAELPGDL AGGFYVQPTV FEGHNKMRIF QEEIFGPVVS VTRFSDYNDA 
MGIANDTLYG LGAGVWSRNG NVAYRAGREI QAGRVWVNNY HAYPAGAAFG GYKSSGIGRE 
NHSMMLDHYQ QTKNLLVSYN ENKLGFF