Gene M446_5353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_5353
Symbol
ID	6129956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	5881951
End bp	5883189
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	73%
IMG OID	641645483
Product	allantoate amidohydrolase
Protein accession	YP_001772105
Protein GI	170743450
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0853444
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGACCA ACCTCTCCGT GAACGGCTCC CGGCTCTGGG ACACGCTGAT GGTCTCGGCC 
GGCATCGGCA CCGGGCCGCG CGGCGGCATC CGGCGCCTCA CCCTCACCGA GCCCGACCGG 
GTCATGCGCG ACCGGCTCAA GGCCTGGGCC GAGGAGGGCG GCTACGCCCT GTCGATCGAC 
CGGCTCGGCA GCATGGTCCT GCGCCGCCCC GGCACCGAGC CCGACCTGCC CCCCGTGGTC 
ATCGGCAGCC ACCTCGACAC CCAGTGGGCG GGCGGGCGCT TCGACGGGAT CCTGGGCGTG 
CTCGCCGGGC TCGAAGTGCT GCGCACCCTC GACGATCTCG GCCTCTCCAC CCGCCGCAGC 
ATCGAGGTGG TGAACTGGAC CAACGAGGAG GGCGCGCGCT TCTCGCCGCC GATGCTCTGC 
TCCCTCGCCT GGTCGGGCCA GCAGAGTCCC GAATGGGTCG AGGGCCGGGT CGACCGGGAC 
GGGATCCGCT TCGGCGACGC CCTCGCGGGA ATCGGCTATC GCGGCCCCGA GCCGGTCGGC 
GGGCGGGCGA TCGACGCCTA TTTCGAGCTC CACATCGAGC AGGGACCCGC CCTCGACCGC 
GCGGGCGTGC CGGTCGGCAT CGTGACCGGC GGCTTCCCGA GCTGCGGCAT GCGCATCGCG 
GTCGAGGGCG AGACCGCCCA TACGGGCCCG ACCCCGATGG CGGAGCGCCA CAACGCGCTC 
GTCGGCGCCG CCATGGTGGC GGTGGCGGTG AACGAGATCG GCTGGGCCCA CGCGGAGGCC 
GACGCCAAGG CCACCGCCGC CCGCCTCGAC CTCGTCCCGA ACCTGCCCGG CACCCTCTCG 
GAATATGCCG AATTGTTCAT CGACATGCGC GCCCCCGAGG TGGAGCGGCT GGAGACCATG 
AAGGCGGCCC TGCGGGCGGC CCTGCCGGAC TGCGCCGAAC GCTCGCGCAC GGCGATCCGG 
ATCGCCGAGG AATGGGGTTT CGGGGTGTTC CAGTTCGACG ACGGGCTGAT CGCGCTCCTG 
CGCGAGACCG CCGCACGGCT CGCCGTCCCG ACCATGGACC TGCGCTCGCA GGCCGGGCAC 
GACGCCTACC ACGTCGCCCG GGTCGCGCCG GCCTGCATGA TCTTCACCCC CTGCAAGGGC 
GGCATCACCC ACAACGAGGC CGAGGCGATC GACCTCGCCG AGACGCTGCC CGGCGTGAAC 
CTGCTGCTCC ACGCCGCGCT CGCCCGCGCC AACCGCTGA

Protein sequence

MATNLSVNGS RLWDTLMVSA GIGTGPRGGI RRLTLTEPDR VMRDRLKAWA EEGGYALSID 
RLGSMVLRRP GTEPDLPPVV IGSHLDTQWA GGRFDGILGV LAGLEVLRTL DDLGLSTRRS 
IEVVNWTNEE GARFSPPMLC SLAWSGQQSP EWVEGRVDRD GIRFGDALAG IGYRGPEPVG 
GRAIDAYFEL HIEQGPALDR AGVPVGIVTG GFPSCGMRIA VEGETAHTGP TPMAERHNAL 
VGAAMVAVAV NEIGWAHAEA DAKATAARLD LVPNLPGTLS EYAELFIDMR APEVERLETM 
KAALRAALPD CAERSRTAIR IAEEWGFGVF QFDDGLIALL RETAARLAVP TMDLRSQAGH 
DAYHVARVAP ACMIFTPCKG GITHNEAEAI DLAETLPGVN LLLHAALARA NR