Gene Arth_3962 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3962
Symbol
ID	4447622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4476902
End bp	4477957
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	63%
IMG OID	639691793
Product	alcohol dehydrogenase
Protein accession	YP_833437
Protein GI	116672504
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGCGC TCGTCTACGG CGGTCCCGGC GAAAAGTCAT GGACCGACGT TCCGGATCCC 
GCCATCCAGA ACCCCAGCGA CGTAATCGTC AAGGTGGACA CCACCACCAT CTGTGGAACG 
GACCTGCACA TCCTCAAGGG GGACGTGCCC GCAGTTCAGA AAGGCCGGAT CCTGGGGCAT 
GAGGGCGTGG GAACCATCAC CGAAGTGGGC TCCTCGGTCA CCAGCCTGAA AGTAGGGGAC 
CGGGTCATCA TCTCCTGCAT CAAGTCCTGC GGCCACTGCG CCAACTGCAA GACCGGTCTT 
TATTCGCACT GCATGGGCGA GGAAGGCGCA GCAGGTATCG GCTGGGTCTT CGGACACCTG 
ATCGACGGTA CGCAGGCCGA ATACGTGCGG GTCCCATACG CGCAGAACTC GCTGCACCTT 
CTCCCCGAAG GGGTCAGCGA CGACCAGGCC GTGATGCTCT CCGACATCCT GCCCACCGGC 
TTTGAAATCG GTGTGCAGTA CGGGCGGGTC AAGCCGGGGG ACACCGTGGC GGTTGTAGGC 
GCGGGGCCGG TCGGGTTGGC AGCAATCGCC ACCGCCGGGC TGTACGGCGC GGCAACCATC 
ATCGCGATCG ACCTTGACGC CAACCGGCTT GAAAAGTCCC GCGAATTCGG CGCCACGGAC 
GTCGTGCTCT CCGGCGACGC CGACTGGAAG GAACAGGTGC TGGCGCTCAC GGACGGACAG 
GGCGTGGATG TGGCCATAGA AGCGGTGGGC ATCCCGGCGA CCTTCGGAAT GTGCACGGAG 
ATCGTGCGCC CCGGCGGCAA CGTGGCCAAC GTCGGCGTGC ATGGAAAGTC CGTCGAACTC 
CATGTGGAGA ACCTCTGGAT CCAGAACATC AACATCAGCA TGGGCCTGGT CAACGCCAAC 
ACCACGCCGA TGCTCCTCAA GCTGGTGGCG CAGAGGAAGG TTCCCGCGGA GAAATTCGCC 
ACCCACCATT TCACGTTCGA CCAGTTCATG GACGCCTACG ACACCTTCGC CCGCGCAGCC 
GAAACCAAGG CACTCAAAGT CGTGATCACG GCGTGA

Protein sequence

MKALVYGGPG EKSWTDVPDP AIQNPSDVIV KVDTTTICGT DLHILKGDVP AVQKGRILGH 
EGVGTITEVG SSVTSLKVGD RVIISCIKSC GHCANCKTGL YSHCMGEEGA AGIGWVFGHL 
IDGTQAEYVR VPYAQNSLHL LPEGVSDDQA VMLSDILPTG FEIGVQYGRV KPGDTVAVVG 
AGPVGLAAIA TAGLYGAATI IAIDLDANRL EKSREFGATD VVLSGDADWK EQVLALTDGQ 
GVDVAIEAVG IPATFGMCTE IVRPGGNVAN VGVHGKSVEL HVENLWIQNI NISMGLVNAN 
TTPMLLKLVA QRKVPAEKFA THHFTFDQFM DAYDTFARAA ETKALKVVIT A