Gene Namu_0834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_0834
Symbol
ID	8446426
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	922992
End bp	924164
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	73%
IMG OID	645039971
Product	Membrane dipeptidase
Protein accession	YP_003200234
Protein GI	258651078
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2355] Zn-dependent dipeptidase, microsomal dipeptidase homolog
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACGC CGGCCGAACG GGTCGCCCGG GTGCTGGCCG CATCCCCGGT GATCGACGGG 
CACAACGACG TCGCCTGGGC CCTGCGCAAA CAGGTCGCCT ACGACCTGAA CCGGCGCGAC 
CTGGCCGAGC ACCAGCCCAC CCTGCACACC GACATCCCCC GGCTGCGGGC CGGCGGCGTC 
GGTGCCCAGT TCTTCTCGGT GTACGTGCCG GGCACGATGA CCGGCGGATC GGCGGTGACG 
GCGACCCTGG AGCAGATCGA CTGCGTGCTG CGGCTCGTGG CCCGGTACCC GGACACCTTC 
GCGGCCGCGC GGACCGCGTC CGAGGTTCGC GCGATCATGG CGGCCGGCCG GATCGCCGCG 
CTGCTGGGCG CGGAGGGTGG GCACAGCATC GACTGCTCGC TGGGCACGTT GCGGATGTTG 
CGGCGGCTCG GCGTCGCCTA CATGACGTTG ACCCACAACC AGAACGTGCC GTGGGCGGAC 
TCGGCCACCG ACGTGCCGGC CGTCGGCGGG CTCAACGATT TCGGCCGGGC GGTGGTGGCC 
GAGATGAACC GGATCGGCAT GCTCGTCGAC CTCTCGCACG TGGCGCCCTC GACCATGCAC 
GCTGCCCTGG ATGCCTCGTC GGCGCCGGTG ATCTTCTCCC ACTCGTCGTG CCGGGCGCTG 
ACCGATCATC CGCGGTGCGT GCCCGATGAG GTGCTCGCCC GGTTGGCCGG CAACGGTGGC 
GTGCAGATGG TGACGTTCGT GCCGCACTTC GTGTCCCAGG AATGCGCCGA GCACGCCGCC 
GCGGAGGACG CCCGCCGGCA CGAGCTGGGC CTGGACCAGG TCACCGTATT CACCGAGCAC 
GACGGCGAGC ACCTGGATCC GGCGGCCCTG GCCGAGTTGG AGCGGTGGCG CGCCGAGCAT 
CCGGCGCCGG TCGCGACGCT GGTCCAGGTG GCCGATCACG TCGACCACGC CCGGGAGGTG 
GCCGGGGTGG CCCACATCGG GCTGGGCGGC GATTACGACG GCGTGGAGTC GCTGCCGCAG 
GGCCTGGCCG ACGTCTCCAC CTACCCGGCG CTGCTGGCCG AGCTGGCCGA CCGCGGCTGG 
TCGGACGCCG ACCTGGCTGG CCTGACCGGC GGCAACATCC TGCGGGTGCT GGACGCCGCC 
GAGCAGGTGG CCGACCCCGG GTTCGGCCGG TGA

Protein sequence

MSTPAERVAR VLAASPVIDG HNDVAWALRK QVAYDLNRRD LAEHQPTLHT DIPRLRAGGV 
GAQFFSVYVP GTMTGGSAVT ATLEQIDCVL RLVARYPDTF AAARTASEVR AIMAAGRIAA 
LLGAEGGHSI DCSLGTLRML RRLGVAYMTL THNQNVPWAD SATDVPAVGG LNDFGRAVVA 
EMNRIGMLVD LSHVAPSTMH AALDASSAPV IFSHSSCRAL TDHPRCVPDE VLARLAGNGG 
VQMVTFVPHF VSQECAEHAA AEDARRHELG LDQVTVFTEH DGEHLDPAAL AELERWRAEH 
PAPVATLVQV ADHVDHAREV AGVAHIGLGG DYDGVESLPQ GLADVSTYPA LLAELADRGW 
SDADLAGLTG GNILRVLDAA EQVADPGFGR