Gene Namu_4901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4901
Symbol
ID	8450531
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5467382
End bp	5468374
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	75%
IMG OID	645043939
Product	Aminocarboxymuconate-semialdehyde decarboxylase
Protein accession	YP_003204164
Protein GI	258655008
COG category	[R] General function prediction only
COG ID	[COG2159] Predicted metal-dependent hydrolase of the TIM-barrel fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCACCG CGGTGGCCGG CGGAGTGGTC GACGTGCACG CGCACTGGTT GCCCCGGGAG 
CTGTTCACGT TGCCGCCCGG CGCACCGTAC GGCGCGCTGA CCGACCGGGC CGGCGAGCTG 
CATCTGGGCG AGGTGCCGCT GTCCATCGCG GCGACCGCGC TGAGCGACGT GCCGGCCATC 
CGGGACGACA TGCGCCGTGC CCGGGTCGGG GTGCGGGTGC TCTCCGCGCC GCCATTCGCC 
TTCCCGGTGG GCGACGCCGG CGCGGGGGCC GACGCGGGTG ACTACGTCGC CTCCTTCAAC 
GAGTCGCTGG CCGCCGTGGT CGGCGAATCC GACGGCGCGC TGGCCGGTCT CGGACTGGTC 
GGGCTGCACG ACCCGGACCG GGTCCGCGAG GAGCTGGCCA CGTTGGCCGT CACGCCCGGC 
ATCGCCGGGG TGGCCATCCC GCCGCTGCTG CGCGGCGACT CGCTGGACCG CGGGGTCCTT 
CGCGAGGTGG TGGTCGGCGC CGCCGAGCTC GACCTGGCCG TGCTCGTGCA CCCGATGCAG 
CTGCCCCGGC CGGAATGGTC GTCGTACTAC CTGGCCAACC TGATCGGCAA CCCGACCGAG 
ACGGCCACCG CGGTGGCCTC GCTGCTGCTG TCCGGCCTGG CCGAGGAGCT CCCGCTGCTG 
CGCATCTGCT TCGTGCACGG CGGGGGCAGC GCCCCCGCCC TGCTCGGCCG GTGGGAGCAC 
GCCTTCACCC GCCGGGCCGA CGTCGCCCGG TCGGCCAAGC GCGGACCCCG CGAGGGCTTC 
CGGGAGCTGT TCCTGGACAC CGTCACGCAT GACCCGGACG CACTGGATCT GCTGGTCGCA 
CAGGCCGGCG ATGGCCGGAT CGTGGCCGGC AGCGACTACC CGTTCGACAT GGCCCAACCC 
CATCCCGTCG CCTTCGCCGT GGACAACGGC CTGCCCGCCG CCACGCTGGC GGCCAGCGGC 
CGGGCGTTCC TCGGCCTGAC CCCGGCCCGG TGA

Protein sequence

MITAVAGGVV DVHAHWLPRE LFTLPPGAPY GALTDRAGEL HLGEVPLSIA ATALSDVPAI 
RDDMRRARVG VRVLSAPPFA FPVGDAGAGA DAGDYVASFN ESLAAVVGES DGALAGLGLV 
GLHDPDRVRE ELATLAVTPG IAGVAIPPLL RGDSLDRGVL REVVVGAAEL DLAVLVHPMQ 
LPRPEWSSYY LANLIGNPTE TATAVASLLL SGLAEELPLL RICFVHGGGS APALLGRWEH 
AFTRRADVAR SAKRGPREGF RELFLDTVTH DPDALDLLVA QAGDGRIVAG SDYPFDMAQP 
HPVAFAVDNG LPAATLAASG RAFLGLTPAR