Gene Namu_3806 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3806
Symbol
ID	8449425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4178317
End bp	4179387
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	71%
IMG OID	645042857
Product	peptidase M14 carboxypeptidase A
Protein accession	YP_003203093
Protein GI	258653937
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2866] Predicted carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.0393058
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.437302
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGTACC GGACCGTCGC CCAACTCGCC GCGGTGCTGA ACCAGGTCAC GGCCGGCGCC 
CCCGAGCTGT GCACGTTGCT GCCCCTGCCC GAGCGGTCGG TCCAGGGATC CGCGGTGTCC 
GCACTGCGCA TCGCCGCCGC CGGCCCGGTG CCGGTGGACG AGCGTCCCGG CGTCCTGCTC 
ATCGCCGGGA CTCACGCCCG CGAGCTGATG AACCCCGACC TGCTGGTCGA ACTGGCCGTC 
GATCTGGTCG CCGCCCAGCG CACCGGGACC GACATCGTGC TCGGCGGCCG GACCTGGCCG 
GCCGCCGCGG TCCGGGCGAT GCTGGCCGCC GCGACGGTGT ACCTGTTGCC GTGCGTCAAC 
CCGGACGGCC GCACCTACGT GCTCACCGTC GACGACATGT GGCGCAAGAA CCGTCGCGAC 
AACCCGGGCA CCACCTGCGA CGGGGTCGAC CTCAACCGCA ACGCGGACAT CCTCTGGGGG 
GTTACCGAAG GCCAGACGTC CTGCTCGCCG TGCACCGACA TCTATTGCGG TTCCGGTGCT 
TTCAGCGAGC CGGAGAACCG GAACGTCAAG CACCTGCTGG ACACCTACCG CATCGACGCC 
TTCGCCGACG TGCATTCGTT CTCCGAGCTG GTCATCTACC CCTGGGGGCA CGCCCCCAGC 
CAGACGACGG ACCCCACGCA GAACTTCCGC ACGCTGACCA CCACGACCTG CCGTCCGTTG 
AACCGCCCCG GCTACGCCGA GTACATCGCC CCGGCCGATC TGGCCCGGTT CCAGGCGGTG 
GCCGGACGGA TCGTCGCCGA GATCGCCGCG GTCCGCGGCC GCCAGTACAG CCCGGAGCCG 
GGCATGACGC TCTACCCGAC CACCGGCACC CACAGCGACT ACGCCTGGAG CCGGCACCTG 
GCCGACCCGA ACCTGCGCCG CACCGAGGGC TACACCATCG AGACCGGCCC CTCCGGTGAC 
GACGCCCGCG AGTCGTTCCA CCCCCGCGAC CCCGAGCCGA TCAAGCGCGA GGTCGAGTCC 
GGGCTGCTCG CCCTGATCCA GGCCACCGCC GCCACCGCCA CCCCCGCCTG A

Protein sequence

MMYRTVAQLA AVLNQVTAGA PELCTLLPLP ERSVQGSAVS ALRIAAAGPV PVDERPGVLL 
IAGTHARELM NPDLLVELAV DLVAAQRTGT DIVLGGRTWP AAAVRAMLAA ATVYLLPCVN 
PDGRTYVLTV DDMWRKNRRD NPGTTCDGVD LNRNADILWG VTEGQTSCSP CTDIYCGSGA 
FSEPENRNVK HLLDTYRIDA FADVHSFSEL VIYPWGHAPS QTTDPTQNFR TLTTTTCRPL 
NRPGYAEYIA PADLARFQAV AGRIVAEIAA VRGRQYSPEP GMTLYPTTGT HSDYAWSRHL 
ADPNLRRTEG YTIETGPSGD DARESFHPRD PEPIKREVES GLLALIQATA ATATPA