Gene Arth_1804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1804
Symbol
ID	4445668
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2019012
End bp	2020061
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	62%
IMG OID	639689622
Product	alcohol dehydrogenase
Protein accession	YP_831294
Protein GI	116670361
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCCG CACGGCTTCA CTCCCCCGGA AATATCAGGG TCGATGACAT CCCCAGACCG 
TCCGCCGACG CGGGTGACAT CATCATCAGA GTCCGGGCCG CGTCGATCTG CGGCACAGAC 
CGTCGGATTG CCGCCAACGG GCATTTCAAG CTTCCGGAAG GGACTCCGCG TGTTCTTGGG 
CACGAGTTTG CCGGCGAGAT TGTGGAGGCG GGCAGCGAGG TCAGTGGTTA CGCCGTCGGA 
GACCGCGTCA GCGTTACGCC CAACGTCGGC TGCGGGACAT GCCCCAACTG CCTCGTTGGG 
CTGAACAACA TGTGCCCCTC CTATGAAGCC TTCGGCATCA CGATGGACGG GGGCTTCCAG 
GAGTACGTCC GGATACCCCG CTTTGCCCTC AACCGAGGCA ACGTGTTCCA CCTTCCGGAG 
ACTGTGGGCT ATGCCGAGGC CGCACTGGTC GAACCACTCT CGTGCTGCTA CAACGCGGTC 
AGCAAACTTG ATGTCCGACC GGACTCCACC GTGCTGATCA TGGGTGCCGG ACCCATCGGG 
GCCTGTCACG TCATGCTGGC AAAGCTCTAC GGCGCCCGGA AAGTCATCGT TTCGAACAAC 
CGGCAACCGC GGCTCGACTT CGCGGGTACT CTCGGCGCCG ATGTGCTGGT CAACCTCACC 
GAACGCGACC TGGCCACTGT CGTGGCCGAG GAAACCGGTG GTCTGGGAGT CGATGTTGCC 
CTGACCTGCG TCTCCAAGCC CGAGGTACAG GCTCAGGCCG TCGACCTGCT GGCAACGCAC 
GGAAGAGTCA ATTTCTTTGC CGGACTCGGC AAAGCGCAAC CTGTTGCCCT TGACACCAAC 
CGGGTCCACT ACCAGGGGCT GACTCTGACC GGTACAACGG GTTCCAGCAA TTCCGATTAT 
GCGTCCGCCC TCAGCCTCGT GGGGGAGGGC AGGCTGGACC TCTCGCCACT GATCAGCCAG 
ACGTTCACAC TGGATGACAT CGAAAAGGCC ATGGACTACG CCGGATCAGG CCAAGGGATG 
AAGGCCATGA TCCTCTTCGA ATCGAACTAA

Protein sequence

MKAARLHSPG NIRVDDIPRP SADAGDIIIR VRAASICGTD RRIAANGHFK LPEGTPRVLG 
HEFAGEIVEA GSEVSGYAVG DRVSVTPNVG CGTCPNCLVG LNNMCPSYEA FGITMDGGFQ 
EYVRIPRFAL NRGNVFHLPE TVGYAEAALV EPLSCCYNAV SKLDVRPDST VLIMGAGPIG 
ACHVMLAKLY GARKVIVSNN RQPRLDFAGT LGADVLVNLT ERDLATVVAE ETGGLGVDVA 
LTCVSKPEVQ AQAVDLLATH GRVNFFAGLG KAQPVALDTN RVHYQGLTLT GTTGSSNSDY 
ASALSLVGEG RLDLSPLISQ TFTLDDIEKA MDYAGSGQGM KAMILFESN