Gene Namu_5074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5074
Symbol
ID	8450705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	5657918
End bp	5659957
Gene Length	2040 bp
Protein Length	679 aa
Translation table	11
GC content	72%
IMG OID	645044110
Product	Peptidyl-dipeptidase Dcp
Protein accession	YP_003204334
Protein GI	258655178
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACGACG TCGCCGAGCC GTCCACCCTC CCGTTCCAGC TGCCGCCGTT TCCCCAGATC 
CGGACCGACG ATCTCGAACC GGCCTTCCTG GCCGCGATGG CCGAGCACCA GGCGCAGGTT 
CGGGCGATCG CCGACAACGT GCAGGAGCCG ACCCTTGCGA ACACGATCGT GGAGCTGGAG 
CGGGCCGGTA CCCGGCTCGT GCGGGTGTCG AGCACGTTTT TCAATCTCAC CGGCACCTGC 
TCGACCGAGG CGTTGCGCGC GGTCGAGGCG CGGGTGGTGC CCGCGCTGAC GGCGCACTAC 
GACCGGATCC GCCTGGATCC GGCGTTGTTC GCCCGGATCG ATGCGATTGC CCGGGCCGAG 
GCGGCCGCAC CCACGCTGAC CGGCGAGGAC GCCCAGCTGC TGCGCCGCTA CCACCTGGAC 
TTCGTGCTGG CCGGCGCCGG GCTGGACGAG CAGGGGCGTC GCCGGCTGGC CGAGCTCAAC 
GAGCAGCTGT CGACGCTGAC CACCCGGTTC GGGCAGAACC TGCTGCAGGC GACCGAGGCC 
GCGGTGGTCG TGGTCGACGA CGTCGCCGAG CTGGACGGCC TGTCCCCGGA CGCGATCGCC 
GCGGCCGCGG CGGCCGCCGC CGACCGGGGG CTGACCGGCA AGTACGTCAT CTCCCTGGTG 
CTGCCCACCG GCCAGCCGCT GCTCAAGGTG CTGCGCAACC GGGACGTGCG CCGCCGGCTG 
TTCGAGGCGT CGGTGCACCG GGCCGAGGGC GGCGAGCACG ACAACCGGCC GCTGGTGCTG 
CAGATCGCGA CGCTGCGGGC CCGGCGGGCG CAGCTGCTCG GATTCGCCAC CCACGCCGAC 
GCGACCGTCG CCGACCAGAC CGTCGGGTCA CTGGCCGCGA TGGACGAGTT CCTGGGCCGG 
CTGGTCGGAC CGGCGGTGGC CAACGCGCGG GCCGAGGCCG AGCTGCTGGC GGCGGCGGCC 
GCCGCGGACG GCGTCGACAA GCTGGCCCCG TGGGACTGGG CCTACTACAG CGAGCGGATC 
TACACCGAGC GCTACCAGGT CGACACCGCC GCGCTGCGCC CGTATTTCGA GCTGGAACGG 
GTGCTCACCG ACGGGGTGTT CGCGGCCGCC CGCGGCCTGT TCGGCATCGA GCTGGTGCCG 
CGGACCGACC TGGTCGGCTA CCACCCGGAG GTGCGGATCT GGGAGGTCCG GGACGCCCAC 
GGCGAGCCGA TCGGGCTGTT CCTGGGCGAC TACTTCGCCC GGGAGGGCAA GCGCGGCGGC 
GCCTGGATGA GCTCATTCGT CGACCAGAAC GAGCTGATGG GCACCCCGCC GGTGATCGTC 
AACGTGCTCA ACATCCCGCA CCCGGCGGCC GGCGAACCGG CCCTGCTCAC GCTGGACGAG 
CTGCGCACGT TGTTCCACGA GTTCGGGCAC GCGCTGCACG GGTTGCTCTC CCGGGTCCGC 
TACCCGCGCT TCTCCGGGAC GAACGTGCCT CGCGACTTCG TCGAGTACCC CAGCCAGGTC 
AACGAGATGT GGATCTTCTG GCCGGAGGTG ATGGCCGGGT ACGCCCGGCA CGTGCACACC 
GGGGAGCCGC TGGCCGCGGC GGTGGTGGAC TCGATCCGGG CCGCCCAGCT GTGGGGCGAG 
GGGTTCGCCA CGGTGGAGTA CCTGGCCGCG ACGCTGCTGG ACCAGGCCTG GCACCGCCTC 
GGGCCCGACG ACGTGGTGCC GGACGTGGTC GAGTTCGAAC GGGCCGCGCT GGCCGCCGCC 
GGGATCGACC TGGCCCTGGT CCCCCCGCGC TACCGCAGCA CCTATTTCCA GCACATCTTC 
GACGGCGGGT ACTCGGCCGG CTACTACTCC TACATCTGGT CGGAGGTGCT GGACGCCGAC 
ACCGTCGACA TGATCACCGA GAACGGCGGC CTGACCCGGG CCAACGGCGA CCACCTGCGG 
GCCACCCTGC TCTCGGTCGG CGGGTCGGTG CCTGCGCTGG ATGCCTTCCG GGCGCTGCGC 
GGTCGGGACG CCCGGATCGA ACCGCTGCTG CGCCGTCGCG GGCTGGACCG GACGGGCTGA

Protein sequence

MYDVAEPSTL PFQLPPFPQI RTDDLEPAFL AAMAEHQAQV RAIADNVQEP TLANTIVELE 
RAGTRLVRVS STFFNLTGTC STEALRAVEA RVVPALTAHY DRIRLDPALF ARIDAIARAE 
AAAPTLTGED AQLLRRYHLD FVLAGAGLDE QGRRRLAELN EQLSTLTTRF GQNLLQATEA 
AVVVVDDVAE LDGLSPDAIA AAAAAAADRG LTGKYVISLV LPTGQPLLKV LRNRDVRRRL 
FEASVHRAEG GEHDNRPLVL QIATLRARRA QLLGFATHAD ATVADQTVGS LAAMDEFLGR 
LVGPAVANAR AEAELLAAAA AADGVDKLAP WDWAYYSERI YTERYQVDTA ALRPYFELER 
VLTDGVFAAA RGLFGIELVP RTDLVGYHPE VRIWEVRDAH GEPIGLFLGD YFAREGKRGG 
AWMSSFVDQN ELMGTPPVIV NVLNIPHPAA GEPALLTLDE LRTLFHEFGH ALHGLLSRVR 
YPRFSGTNVP RDFVEYPSQV NEMWIFWPEV MAGYARHVHT GEPLAAAVVD SIRAAQLWGE 
GFATVEYLAA TLLDQAWHRL GPDDVVPDVV EFERAALAAA GIDLALVPPR YRSTYFQHIF 
DGGYSAGYYS YIWSEVLDAD TVDMITENGG LTRANGDHLR ATLLSVGGSV PALDAFRALR 
GRDARIEPLL RRRGLDRTG