Gene Arth_1794 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1794
Symbol
ID	4445693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2009450
End bp	2010481
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	65%
IMG OID	639689612
Product	alcohol dehydrogenase
Protein accession	YP_831284
Protein GI	116670351
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID	[TIGR01202] 2-desacetyl-2-hydroxyethyl bacteriochlorophyllide A dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0373035
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCCCT CAACCACCCT CACCACCGGA ATCCGGGCCG CGGTTCTTTC CGCCGCCCAC 
CATTTCGAGG TCCAGCATGT CCCGAAACCC AGTCCGGGCC CCGGCGCAGC CCTGGTCCGC 
GTGTCATACA CCGGCATCTG CGGTTCCGAC TTTCCAATTG TTGACGGCCG CCATCCCCGT 
GCCGCAATGC CACTCATCCT GGGGCATGAG ATCACCGGCA TTCTGGAGGA ACCAGGCGGG 
AGCGGAATTC CCGCGGGCAC GAGGGTCGCT GTCAATCCAC TGTTGCCTTG CGGTCAGTGC 
GGTGCCTGCC TAAAAGGGCT GGGGCATGTC TGCCGGAACC TGCGCCTCCT GGGCATCGAC 
GTCCCGGGCT CCATGACTGA AGTCCTGGCC GTTCCGGTGT CGAACCTCTT CGCGTTCTCC 
GCCGACGCGC CGGCGACCGA AGCGGCTCTG GCCGAACCCC TGGCCGTGGC GGTCCACGCC 
GTCCGTCGCT CGCGGTTGGC ACCGGGAGAG AAGGTACTAA TCTTCGGTGC CGGGCCGATA 
GGAATCCTGG TGGCCCTCGT GGCGAGGTTT CGCGGCGCCA AGGATGTGCT CCTTGTCGAG 
CCAAGTGAGC AGCGCCGGCA CATTGTTGAG GCACTCGGCT TCAGGGCCCT TGCTCCGCAG 
GACTCTCCGG TCGCTCGCGA AAATCGCGAG GCCACGGCGG ACGTTGTGTT TGACTGCGCC 
GGGCACTCCA GTGTCACGCC GGCACTAACG GAGGCGGCGC CGGTTCGAGG ACGCATCGTG 
ATCGTCGCCG TGCACCACGG ACCGGCCAAT ATCGATCTGC GTGAGCTCGC CTTTGCCGAG 
CAGGAAATCA TCGGCGTCCG GGTTTACGAA CCGGCCGATT TCGCCGAATC CGTGCAGCTC 
ATCGGAAACC GGGCACTTGG ACTCGCAGGA GTCCCGATAT CCGAATATCC CCTCGAGGCC 
GTTGCCGATG CCTTTGCGGA GGCGCGCTCC GCCGCCGGGG CAGTCAAGGT GATCGTGCGC 
AGCAACAATT AG

Protein sequence

MSPSTTLTTG IRAAVLSAAH HFEVQHVPKP SPGPGAALVR VSYTGICGSD FPIVDGRHPR 
AAMPLILGHE ITGILEEPGG SGIPAGTRVA VNPLLPCGQC GACLKGLGHV CRNLRLLGID 
VPGSMTEVLA VPVSNLFAFS ADAPATEAAL AEPLAVAVHA VRRSRLAPGE KVLIFGAGPI 
GILVALVARF RGAKDVLLVE PSEQRRHIVE ALGFRALAPQ DSPVARENRE ATADVVFDCA 
GHSSVTPALT EAAPVRGRIV IVAVHHGPAN IDLRELAFAE QEIIGVRVYE PADFAESVQL 
IGNRALGLAG VPISEYPLEA VADAFAEARS AAGAVKVIVR SNN