Gene Noca_2034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2034
Symbol
ID	4598656
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2177285
End bp	2178670
Gene Length	1386 bp
Protein Length	461 aa
Translation table	11
GC content	70%
IMG OID	639776637
Product	malate dehydrogenase
Protein accession	YP_923230
Protein GI	119716265
COG category	[C] Energy production and conversion
COG ID	[COG0281] Malic enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.184863
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAACTC CCAGTCCCGG CTACTCGATC ACGGTCCGGA TGGAGGTCCC TTCGTCCGCA 
CGGGCCACCG GAGACGTGGT CGCCGCAGTG ACCGGGGCCG GGGGCTCGGT CACCGCTCTC 
GATGTGGCCG AGTCCCTCGC GGACCGGCTC GTCGTCGACG TCAGCTGCGA CGCCTCCGAC 
CTGGAGCACG CCGACCTGAT CACGGAGGCG CTCAACCGCG TGGACGGTGC GACGGTCCGC 
AAGGTCAGCG ATCGCACCTT CCTGCTGCAC CTCGGGGGCA AGCTCGAGGT CGTGCCGAAG 
GTGCCGCTCA AGCACCGTGA CGACCTCTCA CGCGCCTACA CCCCGGGAGT GGCGAGGGTG 
TGCCTGGCCA TCGCGAAGAA CCCGGAGGAC GCTCGCCGAC TCACCATCAA GCGCAACACG 
GTGGCCGTGG TGACCGACGG CTCGGCGGTC CTGGGACTGG GCAACCTGGG CCCTGCGGCG 
GCCCTGCCGG TGATGGAGGG CAAGGCGGCA CTCTTCAAGC AGTTCGCCGG GGTCGACGCG 
TGGCCGGTCT GCCTCGACAC CCAGGACACC GAGGAGATCA TCGCGATCGT GAAGGCGATC 
GCGCCGGTGT ACGGCGGCAT CAACCTCGAG GACATCGCCG CGCCACGGTG CTTCGAGATC 
GAGGCCCGGC TGCGCGCGGA GCTCGACATC CCCGTGTTCC ACGACGACCA GCACGGTACG 
GCGATCGTGG TGCTCGCCGC TCTCACCAAC GCCCTGCGGG TCGTGGGCAA GCAGCTGAGC 
GAGGTGCGCA TCGTCGTCAG CGGGGTGGGA GCGGCCGGTC ACGCGATCAT CGAGCTGCTG 
CACGCCCAGG GCGCGACCGA CATCGTGGCC TGTGGCCGGA GCGGCTCGGT GCACGGCGGA 
CAGGAGAACC TCGACTCGGC GCGACAGTGG ATCGCCGACC ACACCAACCG CGACCGCTTC 
GCCGGCTCGC TCAGGCAGGC GATGGTCGGG GCGGACGTCT TCATCGGCGT ATCGGCGCCG 
AACCTGCTCA CCGGCGACGA CGTCGCGACG ATGGCCGACG ATGCGATCGT CTTCGCGCTC 
GCGAACCCCG ACCCGGAGGT CGACCCGGTC GCCGCGGGAC AGCACGCAGC GGTGGTCGCG 
ACCGGTCGCT CCGACTACCC CAACCAGATC AACAACGTGT TGGCCTTCCC GGGGTTCTTC 
CGCGGGATGC TCGATGCCGG CACCCACGAC ATCACCCAGG AGGTCATGCT CGCGGCCGCC 
TCCGCGATCG CGGACGCCGT CTCGCCGTCG GAGCTGAACG CCAGCTACAT CGTGCCCTCG 
GTCTTCGACC CCCGTGTCGC AACCGCGGTG GCCGATGCCG TGCGCGAGGC CGCCACGCCG 
GCCTGA

Protein sequence

MATPSPGYSI TVRMEVPSSA RATGDVVAAV TGAGGSVTAL DVAESLADRL VVDVSCDASD 
LEHADLITEA LNRVDGATVR KVSDRTFLLH LGGKLEVVPK VPLKHRDDLS RAYTPGVARV 
CLAIAKNPED ARRLTIKRNT VAVVTDGSAV LGLGNLGPAA ALPVMEGKAA LFKQFAGVDA 
WPVCLDTQDT EEIIAIVKAI APVYGGINLE DIAAPRCFEI EARLRAELDI PVFHDDQHGT 
AIVVLAALTN ALRVVGKQLS EVRIVVSGVG AAGHAIIELL HAQGATDIVA CGRSGSVHGG 
QENLDSARQW IADHTNRDRF AGSLRQAMVG ADVFIGVSAP NLLTGDDVAT MADDAIVFAL 
ANPDPEVDPV AAGQHAAVVA TGRSDYPNQI NNVLAFPGFF RGMLDAGTHD ITQEVMLAAA 
SAIADAVSPS ELNASYIVPS VFDPRVATAV ADAVREAATP A