Gene Noca_4173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4173
Symbol
ID	4596687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4406983
End bp	4407990
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	76%
IMG OID	639778779
Product	short chain dehydrogenase
Protein accession	YP_925357
Protein GI	119718392
COG category	[R] General function prediction only
COG ID	[COG0300] Short-chain dehydrogenases of various substrate specificities
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGGCC GCGTGGTCGT GGTGACCGGC GCGAGCGGCG GCATCGGCCG GGCCTGCGCC 
CGGGCGTTCG CGGCCCGCGG CGACGACGTG GCGCTGCTGG CCCGCGGGGA GACCGGGCTG 
GAGGCGGCCG CCGCCGAGGC GACCGACGCC GGCGTCCGGG CGCTGCCGGT CGAGGTCGAC 
ATGGCCGACG CGGCCGCGGT CGAGGCGGCC GCACTCCGGA TCGAGGCCGA GCTCGGCCCG 
ATCGAGGTGT GGGTCAACGT CGCGTTCACC TCGGTGTTCG CGCGGTTCGT GGACATCGCG 
CCCGAGGAGT TCGCCCGGGT GACCGAGGTC AGCTACCTCG GCTACGTCAA CGGCACCCGC 
AGCGCGCTGC GCCGGATGAC GGCCCGCGAC CGCGGCACGA TCGTCCAGGT CGGCTCGGCG 
CTGGCCTACC GGGGCATCCC GCTGCAGTCG GCGTACTGCG GCGCCAAGCA CGCGATCCAG 
GGGTTCCACG AGTCGCTGCG CACCGAGCTG CTGCACGACG GCAGCCGGGT GCACGTGACG 
ATGGTGCAGA TGCCGGCGGT GAACACCCCG CAGTTCGACT GGGTGCGCTC CCGGCTGCCG 
CGGCACGCGC GGCCGGTGCC GCCGATCTAC CAGCCCGAGT TGGCCGCGGA CGCGGTCGTG 
TACGCCGCCG ACCACCCGAG CCGGCGCGAG TACTGGGTCG GGGAGACCAC GGCGCTCACC 
CTGCTCGCGA ACGCCGTCGC CCCGGGGTTG CTGGACCGCT ACCTGGCCCG CACCGGCTTC 
AAGAGCCAGC AGGCCGACCG GCGCCGCGAC CCCGACCAGC CCGAGAACCT GTGGGCGCCG 
GCCGACGGCG CGGCCGGCGC GGACTTCGGC GCGCACGGCG ACTTCGACGC CCGCTCGCAC 
CGCCGCTCGC CGCAGGTGTG GGCCTCCCAG CACCACGGAC TGCTCGGCGC AGCCGCCGCC 
GGCGGGATCG CGCTGGCCGG CGCGCTCGCC CGCAGGCGGG CCTCGTGA

Protein sequence

MTGRVVVVTG ASGGIGRACA RAFAARGDDV ALLARGETGL EAAAAEATDA GVRALPVEVD 
MADAAAVEAA ALRIEAELGP IEVWVNVAFT SVFARFVDIA PEEFARVTEV SYLGYVNGTR 
SALRRMTARD RGTIVQVGSA LAYRGIPLQS AYCGAKHAIQ GFHESLRTEL LHDGSRVHVT 
MVQMPAVNTP QFDWVRSRLP RHARPVPPIY QPELAADAVV YAADHPSRRE YWVGETTALT 
LLANAVAPGL LDRYLARTGF KSQQADRRRD PDQPENLWAP ADGAAGADFG AHGDFDARSH 
RRSPQVWASQ HHGLLGAAAA GGIALAGALA RRRAS