Gene Mext_3752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3752
Symbol
ID	5832961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	4158421
End bp	4159746
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	72%
IMG OID	641369542
Product	allantoate amidohydrolase
Protein accession	YP_001641197
Protein GI	163853154
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.23358
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCCC TTCCCGAGAC ATCGATGACA TCCATGCCCG ACATGATGAC CTTCGCCCCC 
GTGCGGATCG ATCCCGCCCG CCTCCAGGCG ATGATGGAGG CGGTCTCCGC CTTTGGCGCC 
GGGCCGGACG GCGCCCTGAC CCGCCTGACC CTGTCGCCGG AGGACGGGCA GGCGCGCGAC 
TGGCTCGCCG CGTGGTTTTC CGCGCACGGC TTCACCCCGC GGGTCGATGC GATCGGCAAC 
CAGTTCGGCT GTCTGGAACT GGCCGGACCC GGCGCGCCCA CGGTGATGGT CGGCTCGCAT 
CTCGACAGCC AGCCCAATGG CGGGCGCTTC GACGGCACGC TCGGCGTGCT CGCCGCCTGC 
GAGGCCATCC TGTCCGTGCG CGCGGCGCTC GAAGTGGCGG GCAGGAGGTC GGCCTGCAAC 
TTCACGGTCG CCAACTGGAC CAACGAGGAG GGCGCCCGCT TTCAGCCGAG CCTGCTCGGC 
AGCAGCGTCT TCACCGGTGC GGCCGGGCTC GATTGGGCGC TGGCCCGCAG CGACGGCGAC 
GGCGTCACTG TCGGCGAGGC CCTGTCGCGG ATCGGCTATG CCGGGAGCGA CGCCGTGGCG 
GTGCCGGACG CCTTCATCGA GCTGCATATC GAGGGCGGGC CGATCCTGGA GCGCGAGGGC 
CTGCGCTTCG GCGCCTTCAC CCGCTACTGG GGCGCCACCA AGTACCGCCT CGCCTTCCTC 
GGGCGCCAAG CCCATACCGG CCCGACGCCG ATGGCCGAGC GGCGCGACGC ACTTCTCGGC 
GCCGCCTACC TGATCGCCGA CCTCAAGGCG ATGACGGCCG ATTACGGCCT CGACCTGCAC 
ACCTCCGTCG GCCGGCTCGA AGTGCGGCCG AACTCGCCCA ATACCGTGCC GAGCGAAGCG 
GTTCTGTTCA TCGAGCTGCG CTCCGGCTCG CCCGCGATCC TCGAGGAGGC CGAACTCCGG 
CTGAAGGCGG CTATCGATCT GGCCGCCGCG CGTGCGGAGG TGGGTCACGA GGTACGCGCC 
ATCGACCGGC GCGCCGCCGG CCCGATGGCG CCGGGCCTCG TGCGGCTCGC CGAGCGCGCA 
GGTACGGCCA ACGGCACGAC GACCCGCCAC CTCGACACGA TCGGCGGCCA CGACGCTGTC 
AGCCTCAGCG CCGTCTGCCC CTCGGTGGTG CTGGCCGTGC CCTGCCGCGG CGGCGTGATG 
CACCACCCGA CCGAGTTCAC GAGCCCCGAG GATCAGGCCT TCGGCACGCA GGTGCTGGCC 
GACATGCTGA TGATCCTCGC CACCGAGGGC ATGGCCGCCC TCGAGACCGC GGGAGGGGAC 
CGGTGA

Protein sequence

MPPLPETSMT SMPDMMTFAP VRIDPARLQA MMEAVSAFGA GPDGALTRLT LSPEDGQARD 
WLAAWFSAHG FTPRVDAIGN QFGCLELAGP GAPTVMVGSH LDSQPNGGRF DGTLGVLAAC 
EAILSVRAAL EVAGRRSACN FTVANWTNEE GARFQPSLLG SSVFTGAAGL DWALARSDGD 
GVTVGEALSR IGYAGSDAVA VPDAFIELHI EGGPILEREG LRFGAFTRYW GATKYRLAFL 
GRQAHTGPTP MAERRDALLG AAYLIADLKA MTADYGLDLH TSVGRLEVRP NSPNTVPSEA 
VLFIELRSGS PAILEEAELR LKAAIDLAAA RAEVGHEVRA IDRRAAGPMA PGLVRLAERA 
GTANGTTTRH LDTIGGHDAV SLSAVCPSVV LAVPCRGGVM HHPTEFTSPE DQAFGTQVLA 
DMLMILATEG MAALETAGGD R