Gene Namu_4832 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4832
Symbol
ID	8450462
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5389110
End bp	5390246
Gene Length	1137 bp
Protein Length	378 aa
Translation table	11
GC content	71%
IMG OID	645043871
Product	agmatinase
Protein accession	YP_003204096
Protein GI	258654940
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01227] formimidoylglutamase [TIGR01230] agmatinase

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGCG GGAGCAAGCC GGCAACGGCC GGCCAGTCGG AGAACGACGA CGAGGGTCTG 
CCCACGTTCA GTTCCCGGGA CTGGGTGGCC ACCGCGGCCG GACTGGCCCA GCGCCGGCCG 
GACGTGGCGA TCGTCGGCGC GCCGATGGAC ATCAACACGA CCTACCGGCC GGGAGCCCGG 
TTCGGTCCGA AGTACATGCG GTCCAACGCC TATGACCCCG GCACCTACCA CCTGGACCTG 
GGTCTGGACA TCTTCGAGTG GCTGGACGTG GTGGACGCCG GCAACGCCTA CTGCCCGCAC 
GGCCAGTCGG CGCGGTCGCA ACGCAACATC GAGGCCAAGG TCACCGACGT GCTGCGGGCC 
GACGCCTTCC CGATGATCAT CGGCGGCGAC CACTCGATCA CCTACCCGGC GGCCACCGCG 
GTCGCCCGCA AGTACGGCTG GGGCAAGGTC GGCCTGCTGC ACTTCGACGC GCACGCCGAC 
ACCGCGGACA GCATCGAGGG GCACCTGCAC TCGCACGGCA CCCCGATGCG CCGGTTGATC 
GAGTCGGGCG CGATCCGCGG ACGCAATTTC GTCCAGGTCG GGCTGCGCGG CTACTGGCCG 
CCGCCGGAGG TCTTCGACTG GATGCGCGAG CAGGAGATGA CGTGGCACCT GATGCACGAC 
GTGTGGGACC GGGGCATGCG GCCGGTCATC GCCGACGCCA TCGCCCGGGC CGGCGACGGG 
TGCGACTGGC TCTACCTGTC GGTCGACATC GACGTGCTCG ACCCGGGTTT CGCCCCCGGT 
ACGGGAACTC CGGAGCCGGG CGGGATGAAC CCGGCGGACC TGCTGCGGGC GGTCCGGCAG 
ATCGCGCTGG AGACCCCGCT GGTCGCGATG GACGTGGTCG AGGTCTCGCC GCCGTACGAC 
CACGCCGACA ACACCGTCAA CAACGCGCAC CGGGTCATCC TGGAGGCGCT GGGCGCGCTG 
GCCACCAAGA AGCGGGAGCG GGCCGGCGGC GCGGTGACCC GGCCGGGCAG CCGCCCCGAT 
CCCGCCCGGC TGCGCTATCC GGTCGAGCCC ACCGAGTGGT CGCGCCCCGG TGACGGGACG 
AACACCTATA CCGACGCGGA CGCCCACCTG CAGGGCGAGC ACGACGACCA CACCTGA

Protein sequence

MSGGSKPATA GQSENDDEGL PTFSSRDWVA TAAGLAQRRP DVAIVGAPMD INTTYRPGAR 
FGPKYMRSNA YDPGTYHLDL GLDIFEWLDV VDAGNAYCPH GQSARSQRNI EAKVTDVLRA 
DAFPMIIGGD HSITYPAATA VARKYGWGKV GLLHFDAHAD TADSIEGHLH SHGTPMRRLI 
ESGAIRGRNF VQVGLRGYWP PPEVFDWMRE QEMTWHLMHD VWDRGMRPVI ADAIARAGDG 
CDWLYLSVDI DVLDPGFAPG TGTPEPGGMN PADLLRAVRQ IALETPLVAM DVVEVSPPYD 
HADNTVNNAH RVILEALGAL ATKKRERAGG AVTRPGSRPD PARLRYPVEP TEWSRPGDGT 
NTYTDADAHL QGEHDDHT