Gene Noca_1999 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_1999
Symbol
ID	4598315
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	2140340
End bp	2141527
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	76%
IMG OID	639776603
Product	alcohol dehydrogenase
Protein accession	YP_923196
Protein GI	119716231
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0396672
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCGCGC TGGAGATGTT CCGGTCGGTC TCGCGGACCA TGGCCGGCAA GGCGATCGGC 
GGCCGGATGC CCGGCGTGCT GTCCGGCTTC GCCGCGCCGC TGCGGCTGGT CACCATCGAC 
GAGCCGCGGG TCGAGCGGCC CGGCTGGGCG CGGCTGCGCA CCCGGCTCTC CGGCATCTGC 
GGCTCCGACC TGGGCGCGCT CTCGGGCCGC ACCAGCCTGT ACTTCTCCGC GGTCGTGTCG 
CTGCCGTTCG TGCCCGGGCA CGAGGTGGTC GCCGAGCTGC TGGACGACTG CGAGGACCTG 
CCGGCCGGCA CCCGCGTCGT GGTCGACCCC GTGCTGGGCT GCGCCGCGCG GGGTGTCGAG 
CCGTGCGAGG CGTGCGCGGC CGGCGCGACC AACCGGTGCG CCCGGATCAC CGTCGGGCAC 
CTCTCACCCG GCCTGCAGAC CGGGTTCTGC CACGACACCG GCGGCGGCTG GGGCCAGCAG 
CTGGCCGCCC ACCGCAGCCA GCTCCACCCG GTCCCGGAGG GCTTCTCCGA CGAGCAGGCG 
ATCCTGATCG AGCCGGTGGC CTGCGCCGTG CACACGGCGC TGCGCGCCGG GGTCGCCGCC 
GGCGACCGGG TGCTGGTCAG CGGGGCCGGG TCGGTCGGGC TGTTCGCCAC GCTCGCGCTG 
CGCGAGCTCA CCGAGGCGGG CGAGATCATC GTGGTCGCCA AGCACCCCCA CCAGCGCGAG 
CTGGCCCGCG AGCTGGGCGC GACCGAGGTC GTCGCGCCGG GCGAGGTGCT GCGGCGGGTA 
CGCCGCTCCA CGGGCGCCTT CCAGCTCGAG CCGGAGTTCT CCACGCCGTA CCTCCTCGGC 
GGCGTCGACG TCGCCGTCGA CGCGGTCGGG AGCAAGCAGT CGCTGGAGAG TGCCCTCCAG 
GCCACCCGGG CCGGGGGCCG GGTGGTGCTG TCCGGCATGC CCGCCGCCGC CGACCTGTCC 
GCCGCCTGGT TCCGCGAGCT CGAGGTGGTC GGCACCTACG CCTCGTCCCG CTCCGACGAC 
GCGTTCGGGA GGGCGACCGA GCTGGTCGCC ACCGACGCCG TCCAGCAGCT TGCCAAGAGC 
GTCGCCAGCT ATCCGCTGCA CCGGTGGCGC GAGGCGCTCG ACCACGCCCA CTCGGCCGGC 
CGGCTCGGCA CGGTCAAGGT GGCCTTCGAC CCCCGCTCGT CCCACTGA

Protein sequence

MLALEMFRSV SRTMAGKAIG GRMPGVLSGF AAPLRLVTID EPRVERPGWA RLRTRLSGIC 
GSDLGALSGR TSLYFSAVVS LPFVPGHEVV AELLDDCEDL PAGTRVVVDP VLGCAARGVE 
PCEACAAGAT NRCARITVGH LSPGLQTGFC HDTGGGWGQQ LAAHRSQLHP VPEGFSDEQA 
ILIEPVACAV HTALRAGVAA GDRVLVSGAG SVGLFATLAL RELTEAGEII VVAKHPHQRE 
LARELGATEV VAPGEVLRRV RRSTGAFQLE PEFSTPYLLG GVDVAVDAVG SKQSLESALQ 
ATRAGGRVVL SGMPAAADLS AAWFRELEVV GTYASSRSDD AFGRATELVA TDAVQQLAKS 
VASYPLHRWR EALDHAHSAG RLGTVKVAFD PRSSH