Gene Arth_1800 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1800
Symbol
ID	4445664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	2014919
End bp	2015878
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	63%
IMG OID	639689618
Product	D-isomer specific 2-hydroxyacid dehydrogenase, NAD-binding
Protein accession	YP_831290
Protein GI	116670357
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0111] Phosphoglycerate dehydrogenase and related dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00330988
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCATGG CTTCGCTGAA CCTCACCGAG CCAGGCCGCA ACGGCCGCAT TGCAGTGACC 
CCCCGCTCCT TGTCAGACGG GGGGCACCCT GCCCTGCAGA AGCTGGAACG CGCAGGATAC 
GAACTGGTTT ATCCGTCTCC CGGTGCAGTG CCCAATGAAG ATCAGATCCG CGCCGGCGTG 
TCGGAGTGCG TCGGCTACCT TGCGGGCACC GAACGCCTTT CCGGACAGGT ACTGGAGGAC 
CTTACTCGGC TGAAAGCCAT CTCCCGGAAC GGCGTCGGCG TGGATTCGAT CGATGTCGAA 
GCGGCCGAGC GTCTGGGGAT CAACGTACTC ACCGCGCCAG GCGCCAACTC GCAGGGAGTA 
GCGGAACTTA CCATCGCACT GATTCTGGCC GGGAGCCGCA GCATCCCCTG GCACGATGCC 
CAGCTGAAGT CGGGCCAATG GAACCGCCGG CCCGGCAATG AAGTGTCAGG GAAAGTCCTT 
GGTCTGATCG GATGCGGCCA GATCGGCCGG CGGGTTGCGA CGATGGCGCT TGGACTAGGC 
ATGAAGGTGA TTGCCTTCGA CGAATATCCC GTGACATCGT TCGCTCCTTC GCCCGACTTC 
TCATGGGCAC CACGGGAGCG TGTTTTGTCA TCGAGCCACG TCGTATCGCT GCACACTCCG 
CCGTCCGGGC AACCGGTTCT CGGAGCCGCG GCAATCCGGC TGCTCCAATG GGGTACCGGC 
GTCATCAACA CTGCGCGGGC ATCCCTGATC GACGACGAGG CGCTGCTACA GGCTCTCGAC 
TCCGGGCAGG TCGAGTATCT GGCCACCGAC GTGTTCAGTT CCGAACCCCC TGCACCCAGC 
CGGCTGATTA CGCACCCGAG GGTCATCACA ACGCCGCACA TCGGTGGATA CACTAAGGAA 
AGCGTGGACC GAGCCACACA GGCCGCTGTG GACAACCTGC TTCACGCCCT CGCCACCTAG

Protein sequence

MSMASLNLTE PGRNGRIAVT PRSLSDGGHP ALQKLERAGY ELVYPSPGAV PNEDQIRAGV 
SECVGYLAGT ERLSGQVLED LTRLKAISRN GVGVDSIDVE AAERLGINVL TAPGANSQGV 
AELTIALILA GSRSIPWHDA QLKSGQWNRR PGNEVSGKVL GLIGCGQIGR RVATMALGLG 
MKVIAFDEYP VTSFAPSPDF SWAPRERVLS SSHVVSLHTP PSGQPVLGAA AIRLLQWGTG 
VINTARASLI DDEALLQALD SGQVEYLATD VFSSEPPAPS RLITHPRVIT TPHIGGYTKE 
SVDRATQAAV DNLLHALAT