Gene Noca_3651 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3651
Symbol
ID	4595763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3875558
End bp	3876655
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	73%
IMG OID	639778259
Product	alcohol dehydrogenase
Protein accession	YP_924838
Protein GI	119717873
COG category	[C] Energy production and conversion
COG ID	[COG1062] Zn-dependent alcohol dehydrogenases, class III
TIGRFAM ID	[TIGR03451] mycothiol-dependent formaldehyde dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.198781
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGCAGG TCAAGGCCGT GATCGCCCGC GGCAAGGGGC AACCCGTCGA GGTGACCACC 
ATCAACGTGC CCGACCCGGG CCCGGGCGAG GCACTCGTCC AGGTGCAGGC CTGCGGGGTC 
TGCCACACCG ACCTGCACTA CCGCGAGGGC GGCATCAACG ACGACTTCCC GTTCCTCCTC 
GGTCACGAGG CCGCCGGCGT CGTCGAGGCG GTCGGCCCGG ACGTGACGGC CATCGCCCCG 
GGCGACTTCG TGATCCTGAA CTGGCGGGCC GTGTGCGGCG AGTGCCGGGC CTGCGAGCGC 
GGCGAGCCGT GGTACTGCTT CGCGACCCAC AACGCCACCC AGCGGATGAC CCTCGCCGAG 
GGTCCCGACG CCGGCACCGA GCTCGCGCCG GCCCTCGGGA TCGGCGCGTT CGCCGAGAAG 
ACCCTGGTCG CGGCCGGCCA GTGCACGAAG GTCGACCCGT CGGCCCGGCC GGCCGCCGTC 
GGGCTGCTCG GCTGCGGGGT GATGGCGGGG ATCGGAGCCG CGATCAACAC CGGCGCGGTC 
ACCCGCGGGA AGTCCGTCGC GGTCATCGGC TGCGGCGGCG TCGGCGTGGC CGCGATCGCC 
GGCTCGGCGC TCGCCGGGGC CTCGCCGATC ATCGCGGTCG ACATCGACGC CCAGAAGCTG 
GAGGCCGCGC GCCGGATGGG CGCCACCCAC GTCGTCGACT CCAGCCGGAC CGACCCGGTC 
GCGGCGATCC AGGAGCTCAC CGGCGGCTTC GGCGCGGACG TCGTCATCGA GGCCGTCGGC 
CGCCCGGAGA CCTGGAAGCA GGCGTTCTAC GCCCGCGACC TGGCCGGCAC GGTGGTGCTG 
GTCGGCGTAC CGACGCCCGA GATGAAGGTC CCGGACCTCC CGCTCATCGA CGTCTTCGGC 
CGGGGCGGGT CGCTGAAGTC GAGCTGGTAC GGCGACTGCC TGCCCAGCCG CGACTTCCCG 
ATGCTCGTCG ACCTCTACCA GCAGGGCCGG CTGGACCTGG ACGCCTTCGT CAGCGAGGAG 
ATCGGCATCG GCGACGTCGA GGCGGCGTTC GAGCGGATGC ACGAGGGCGG CGTGTTGCGC 
TCGGTGGTGA TCCTCTGA

Protein sequence

MQQVKAVIAR GKGQPVEVTT INVPDPGPGE ALVQVQACGV CHTDLHYREG GINDDFPFLL 
GHEAAGVVEA VGPDVTAIAP GDFVILNWRA VCGECRACER GEPWYCFATH NATQRMTLAE 
GPDAGTELAP ALGIGAFAEK TLVAAGQCTK VDPSARPAAV GLLGCGVMAG IGAAINTGAV 
TRGKSVAVIG CGGVGVAAIA GSALAGASPI IAVDIDAQKL EAARRMGATH VVDSSRTDPV 
AAIQELTGGF GADVVIEAVG RPETWKQAFY ARDLAGTVVL VGVPTPEMKV PDLPLIDVFG 
RGGSLKSSWY GDCLPSRDFP MLVDLYQQGR LDLDAFVSEE IGIGDVEAAF ERMHEGGVLR 
SVVIL