Gene Noca_2120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2120
Symbol
ID	4599964
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	2267364
End bp	2268464
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	67%
IMG OID	639776723
Product	alcohol dehydrogenase
Protein accession	YP_923316
Protein GI	119716351
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGTCA CCGCTGCCGT TTCCCGTGAG AAGGGCGCGC CGCTCGTCGT CGAGGAGCTG 
GAGCTGGATG CGCCACGCTC CACCGAGGTG CGCGTGCGAA TGGTGGGTTC CGGGATCTGC 
CACACCGACG CTGTTGCCCG GGACCGCATC TACCCGGTGC CCGAGCCGTC GGTCTTCGGA 
CACGAGGGGT CTGGCGTCGT CGAGGAGGTC GGCTCCGATG TGCGTGGCGT GCAGGTGGGG 
GACCACGTCG TGCTGGGCCC GTCGTACTGC GGCAAGTGCA CCTTCTGCCG AAGCGGTGAG 
CCGATGTACT GCGAGAACGG CTTCCCCGAG CTGTTCGGTT GTCGTCGGCA CGATGGGACC 
ACGGCCTTCA GCAAGGATGG CGAGATGGTC GGCTCCCACT TTTTCGGGCA GTCGTCGTTC 
GCGACCCACG CCAACGTCAC CGAGAACAGC GTCATCGTCG TCGACAAGGA CGCCCCGCTG 
GAGCTGCTCG GCCCACTGGG ATGCGGGCTC AACACCGGTG CGGGGGCCGT GCTCAACGAG 
ATGCGGCCGG CGGCCGGGTC CTCGATTGTC GTCTTCGGTA CCGGAGCGGT CGGCTTCGCC 
GCGCTCATGG CGGCAGCCGC GGTGTCGTGC TCCACGATCA TCGGCGTCGA CATCCACGAC 
TCCCGTCTGG AGCTGGCCCG GGAGCTGGGC GCGACGCACA CCATCAACTC CTCGTCCCAG 
GACCTGCATG CCGAGCTGGA GAAGATCACC GGCGGGCGGG GCGTGAACTA CGCACTGGAC 
ACCACCGCGA GGTCAAGCGT GGTTCGGGAC GCTGCCGATG CGCTCGGCAA GCGGGGTGTG 
CTCATCGCGG TCGGCGCGGC CGCGCCCGGC GATGAGGTCA GCTTCGAGGT CGGCAACTCT 
CTGGTCAAGG GCTGGACCTT CAAGACCGTG ATCGAGGGGT CGGCAGTGCC GCAGGTGTTC 
ATCCCGCGCC TGGTCGACCT GTGGAAGCAG GGCAAGTTCC CCTTCGACAA GCTGGTGAAG 
ACCTACTCCC TGCATGACAT CAACACCGGC TTCGAGGACT CCGCCTCCGG GGCCGTCATC 
AAGCCCGTGG TTGCCTACTG A

Protein sequence

MTVTAAVSRE KGAPLVVEEL ELDAPRSTEV RVRMVGSGIC HTDAVARDRI YPVPEPSVFG 
HEGSGVVEEV GSDVRGVQVG DHVVLGPSYC GKCTFCRSGE PMYCENGFPE LFGCRRHDGT 
TAFSKDGEMV GSHFFGQSSF ATHANVTENS VIVVDKDAPL ELLGPLGCGL NTGAGAVLNE 
MRPAAGSSIV VFGTGAVGFA ALMAAAAVSC STIIGVDIHD SRLELARELG ATHTINSSSQ 
DLHAELEKIT GGRGVNYALD TTARSSVVRD AADALGKRGV LIAVGAAAPG DEVSFEVGNS 
LVKGWTFKTV IEGSAVPQVF IPRLVDLWKQ GKFPFDKLVK TYSLHDINTG FEDSASGAVI 
KPVVAY