Gene Arth_0233 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0233
Symbol
ID	4447324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	245239
End bp	246711
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	70%
IMG OID	639688029
Product	aldehyde dehydrogenase
Protein accession	YP_829734
Protein GI	116668801
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACCA CAGCCGGCCA GCTGAACGCA TCAGTCGAGG CCGCCCACGC TGCCTTCGAA 
AAAGCCCGCC TGGCAGGTCC CGGAACACGG GCAGCCTGGC TCGAAGCGGT GGCCGCCGGC 
CTGGAAGGCG ACGCTGTGAC CCTCATCGGA ATCGCGGCCG CGGAAACCCA CCTCGCCGAA 
CCACGACTCC AGGGCGAGCT GAAGCGCACC GTCTTCCAGC TCCGGCTCTT CGCCGACGAG 
ATCCGCCGCG GCGAGCACTT CGACGCGACG ATCGACCATG AGGATGCCGC CTGGGGCATG 
GGGCCGCGGC CCGACCTTCG CCGCTACAAC GTGCCGCTCG GCGTGGTCGG CGTCTTTGGG 
GCGTCCAACT TCCCGTTCGC CTTCAGTGTG ATGGGCGGTG ACTCCGCGTC GGCCCTGGCG 
GCCGGCTGTG CCGTCGTCCA CAAGGCACAC GACGGACACC GGGAACTTGC GGTCCGCACG 
GCCGAAACGG TGACCACCGC ACTCGAGGCT GCCGGGGCGC CGTCGGGCCT CTTCTCCCTG 
GTCACCGGCC GCCAGGCTGC GGAGGCGCTG GTTGAGCACC CGCTGGTGAA GGCCATCGGG 
TTCACGGGTT CGACGGCGGG CGGCCGGGCT TTGTTCGACC GTGCAGCTGC GCGGCCCGAA 
CCGATCCCGT TCTTTGGCGA ACTGGGCGGC ATCAATGCCG TTTTCGTTAC CGGCAACGCC 
TGGTCCGCGC GCCGCGAGGA GATCCTGGGC GGCTTTGCCG GCTCCTTCAC CCTGGGAATG 
GGTCAGTTCT GCACCAAGCC GGGTGTGCTC TTCCTCCCGG CCGGGGAAAC TGAGAAGGTC 
CGGGACAGCC TCCGGAAAGC CCTCGCGGAC TTCGCTCCGG CGCCGCTGCT CAGCGAACGG 
CTGCACGAAG GGTTCCGGCA GGCAGTTGCC GGGCTTCGGG ACACGGCGGG CGTGCAGGTG 
CTGGTGGACG GCGATTTCGC CGAGTCGCCG GCGCCCACCG TCCTGATGAC CACGGCCGAT 
GCTGTCCGCC GGGATCCCGG CATCCTCCGC CAGGAGATGT TCGGACCGGC CAGCCTGGTG 
GTCGAATACA ACGACGACTC CGAGCTCGCC GCCCTTGCCG GGCTCCTGGA AGGCCAGCTG 
ACCACCACCC TGCAGGCCGA AGCGGAGGAT GACGTCGCCG AACTTGCCGG CAGGCTCGCG 
GACATCAGCG GACGCCTGCT CTGGAACGGC TGGCCAACGG GGGTGACCGT CAGTTACGCC 
CAGCACCACG GCGGGCCGTA CCCGGCCACG ACGTCTGGCA CCACCTCCGT GGGGACGGCC 
GCCATCCGGC GGTTCCTCCG GCCGGTGGCC TTCCAGTCCT TTCCGGAGCC GCGGCTGCCG 
GAGCCGCTGC AGGATGCGAA CCCGTGGAAC GTCCCGCAAA GGGTCGACGG CGTTTGGCAG 
CGGCCGTCCG CACAGCCGGA CGGCCAGCCG TGA

Protein sequence

MNTTAGQLNA SVEAAHAAFE KARLAGPGTR AAWLEAVAAG LEGDAVTLIG IAAAETHLAE 
PRLQGELKRT VFQLRLFADE IRRGEHFDAT IDHEDAAWGM GPRPDLRRYN VPLGVVGVFG 
ASNFPFAFSV MGGDSASALA AGCAVVHKAH DGHRELAVRT AETVTTALEA AGAPSGLFSL 
VTGRQAAEAL VEHPLVKAIG FTGSTAGGRA LFDRAAARPE PIPFFGELGG INAVFVTGNA 
WSARREEILG GFAGSFTLGM GQFCTKPGVL FLPAGETEKV RDSLRKALAD FAPAPLLSER 
LHEGFRQAVA GLRDTAGVQV LVDGDFAESP APTVLMTTAD AVRRDPGILR QEMFGPASLV 
VEYNDDSELA ALAGLLEGQL TTTLQAEAED DVAELAGRLA DISGRLLWNG WPTGVTVSYA 
QHHGGPYPAT TSGTTSVGTA AIRRFLRPVA FQSFPEPRLP EPLQDANPWN VPQRVDGVWQ 
RPSAQPDGQP