Gene Namu_4139 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4139
Symbol
ID	8449765
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4575205
End bp	4576920
Gene Length	1716 bp
Protein Length	571 aa
Translation table	11
GC content	63%
IMG OID	645043188
Product	malate dehydrogenase
Protein accession	YP_003203417
Protein GI	258654261
COG category	[C] Energy production and conversion
COG ID	[COG0281] Malic enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0000025754
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000138599
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCTGTCG CCCCGTATGA GCTGGTCCAT CAACCGCGGG AGGTGGTGGC GCGGGTGCGT 
GCTCGTGGTC GCCTGGTGTT GTCCTCGCCG ACGATTAATC GGGGGACGGC GTTCACGTTG 
GCGCAGCGGG AGCAGTTGGA GTTGACGGGG TTGTTGCCGA CGGGGGTGTC GACGTTGGAG 
GGTCAGGTTC GGCGGGTGTG GGCGCAGTAT TTGCAGCAGC CGTCGGATTT GGCGAAGTGG 
GTGTATTTGG CGAATTTGCG GGATCGTAAC GAGGTGTTGT TCTACCGGTT GTTGTCGGAG 
CATTTGCCGG AGATGTTGCC GGTGGTGTAT ACGCCGACGG TGGGGACGGC GATCGAGCGG 
TTCAGTCATG AGTTCCGGCG TAGTCGGGGT GTGTTTTTGT CGGTGGATCA TCCGGATCAG 
GTGGAGACCG CGTTGCGGAA CACTGGTTTG GGTCCGGATG ATGTTGATTT GTTGGTCGCG 
ACGGATTCCG AGGGGATTTT GGGGATCGGT GATCAGGGGA TCGGTGGTAT TGAGATCTCG 
ATCGGGAAGT TGTCGGTGTA TACGGCGGCG GCGGGGATTC ATCCGCGGCG GGTGTTGCCG 
GTGGTGTTGG ACATGGGTAC CGATAATTTG CGGTTGTTGA ATGATTCGAT GTATTTGGGT 
GAGCGGCATG CGCGGGTGCG GGATCATCGG TATGACGAGT TGATCGATGC GTATGTGACG 
GCGTGTAACA AGTTGTTCCC GAACGCGATG TTGCATTGGG AGGATTTCGG GACGGAGAAC 
GCCCGCCGGA TTCTGAACAA GTATTCGGGG GTGTGTTGCA CGTTCAATGA TGATATGCAG 
GGCACGGCGG CGGTGGTGTT GGCGGCGGTG TTCTCGGCGG TGCGGGCGGC GGGGTCGCGG 
TTGGCTGATC AGCGGATCGT GATCCATGGG GCGGGTACGG CCGGGTTGGG GATCGCGGAC 
ATGTTGCGGG ATCAGATGAT CCGGGAGGGG TTGTCGCCGG CGGAGGCGAC GGGCCGGTTC 
TATGCGTTGG CCAAGCAGGG GTTGTTGGTT GATGACGATC CGTCGTTGTT GGATTTCCAG 
GTGCCGTATG CGCGCTCGCG CGCCGAGGTG GCGGGGTGGC CGGCGGGTGC GGGTGGGGTC 
GGGTTGGCCA CGGTGGTGTC GCGGGCGCGG CCGACGATTT TGATCGGGAC GTCGACGCAG 
GCGGGGGCGT TCACGGAGTC GATCGTGCGG GAGATGGCTT CGTTCAATGC GCGGCCGATC 
ATTTTGCCGT TGTCGAATCC GACGAGTAAG GCCGAGGCGT TGCCGCAGGA TCTGATCCAT 
TGGACGGACG GGAAGGTGTT GACCGCGACG GGTAGTCCGT TCGAGCCGGT GCATTACAAG 
GGGGTGGCGT ATCAGATTGC GCAGTCGAAC AATGCGTTGG TGTTTCCCGG GTTGGGGTTG 
GGGGTGGCGG TGACGAAGGC GTCGCGGATC AGTGAGGGGA TGATCGCGGC GGCGGCGGAT 
GCGGTGGCGG CGATGTCGGA TGCGCGCACG CCGGGGGCGA GTTTGTTGCC GCCGATGACG 
GTGTTGCGGA CGGCGTCGGC GGCGGTGGCG ATCGCGGTGG CGAAGGCGGC CGATGCCGAG 
GGGTTGGCGC GGGTGGAGCT GAGTAATCCG GTGCAGCAGG TGTATGACGC GATGTGGCAG 
CCGGAGTATC CGCGGATCGA GCCGATCGAG GCCTGA

Protein sequence

MAVAPYELVH QPREVVARVR ARGRLVLSSP TINRGTAFTL AQREQLELTG LLPTGVSTLE 
GQVRRVWAQY LQQPSDLAKW VYLANLRDRN EVLFYRLLSE HLPEMLPVVY TPTVGTAIER 
FSHEFRRSRG VFLSVDHPDQ VETALRNTGL GPDDVDLLVA TDSEGILGIG DQGIGGIEIS 
IGKLSVYTAA AGIHPRRVLP VVLDMGTDNL RLLNDSMYLG ERHARVRDHR YDELIDAYVT 
ACNKLFPNAM LHWEDFGTEN ARRILNKYSG VCCTFNDDMQ GTAAVVLAAV FSAVRAAGSR 
LADQRIVIHG AGTAGLGIAD MLRDQMIREG LSPAEATGRF YALAKQGLLV DDDPSLLDFQ 
VPYARSRAEV AGWPAGAGGV GLATVVSRAR PTILIGTSTQ AGAFTESIVR EMASFNARPI 
ILPLSNPTSK AEALPQDLIH WTDGKVLTAT GSPFEPVHYK GVAYQIAQSN NALVFPGLGL 
GVAVTKASRI SEGMIAAAAD AVAAMSDART PGASLLPPMT VLRTASAAVA IAVAKAADAE 
GLARVELSNP VQQVYDAMWQ PEYPRIEPIE A