Gene Noca_3749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3749
Symbol
ID	4598611
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3969313
End bp	3970293
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	73%
IMG OID	639778357
Product	aldo/keto reductase
Protein accession	YP_924936
Protein GI	119717971
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGCAGC GCACCCTCGG CCGGACCGGG CGTCCGGTCT CCGTGGTCGG ACTCGGCACC 
TGGCAGCTCG GCGCGGACTG GGGGGACGTC TCCGAGGACG ACGCCCTCGC CGTCCTCGGC 
GCCTCGGTCG ACGCCGGTGT CACGTTCTTC GACACCGCCG ACGTGTACGG CGACGGGCGC 
AGCGAACAGG TGATCGGCCG GTTCCTGCGC GAGCACCCCG AGGTCGTCGT GGCCACCAAG 
ATGGGTCGTC GCGTCGAGCA GCTGCCCGAG CACTACACGC TCGAGAGCTT CCGGGCCTGG 
ACCGACCGGT CGCGACGCAA CCTCGGCGTC GACACCCTCG ACCTCGTGCA GCTGCACTGC 
CCCCCGAGCG CGGTCATCGA CGCGGACGCG ACGTACGACG CGCTCGACAC GCTGGTCGCC 
GACGGCGCGA TCGCGGCGTA CGGCGTGAGC GTCGAGACCG TCGACCAGGC ATTGTCCGCC 
ATCGCGCGCC CGCACGTCGC GTCGATCCAG ATCATCCTCA ACGCGTTCCG CCTCAAGCCG 
TTGGACCGGG TGCTGCCGGC GGCGGCGGAG GCCGGGGTCG CGATCATCGC CCGGGTGCCG 
CTCGCGTCCG GCCTGTTGTC GGGTCGCTAC GACGAGCACA CGACGTTCGC CCCGGACGAC 
CACCGCAGCT ACAACCGCGA CGGCAGCGCC TTCGACGTGG GGGAGACGTT CTCGGGCGTC 
GACTACGAGA CCGGCGTCCG CGCGGCGCAG GAGTTCTCGC AGCTGGTGCG TGACCTGGAC 
CTGACGCCCG CGCAGGCGGC GATCGCGTGG GTGGTGCAGC AGCCGGGCGT CACCACGGTG 
ATCCCGGGCG CCCGCAACGC CGAGCAGGCG CGCGCCAACG CGGTCGCCGG ACTGGCCGGG 
CCGCTGCCCG GCTCCGTCCT GGACGGGGTC ACGCGGATCT ACGACACGAG GCTCCGCGCG 
GCGATCCACG ACCGCTGGTA G

Protein sequence

MEQRTLGRTG RPVSVVGLGT WQLGADWGDV SEDDALAVLG ASVDAGVTFF DTADVYGDGR 
SEQVIGRFLR EHPEVVVATK MGRRVEQLPE HYTLESFRAW TDRSRRNLGV DTLDLVQLHC 
PPSAVIDADA TYDALDTLVA DGAIAAYGVS VETVDQALSA IARPHVASIQ IILNAFRLKP 
LDRVLPAAAE AGVAIIARVP LASGLLSGRY DEHTTFAPDD HRSYNRDGSA FDVGETFSGV 
DYETGVRAAQ EFSQLVRDLD LTPAQAAIAW VVQQPGVTTV IPGARNAEQA RANAVAGLAG 
PLPGSVLDGV TRIYDTRLRA AIHDRW