Gene Mext_1535 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1535
Symbol
ID	5831972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	1714861
End bp	1715880
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	75%
IMG OID	641367333
Product	urea amidolyase related protein
Protein accession	YP_001639005
Protein GI	163850962
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.0888352
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCCC ACCTCCACAT CACCCGCCTC ACCGGCGCGG CCTCGCTTCA GGATGGCGGA 
CGGCGCGGCT TTCTCCGCTT CGGGCTTTCG GCCTCCGGGC CGATGGACCC GCTCGCCTTC 
GCCGCCGCCA ACCGCCTCGT CGGCAACCCG GCCGATGCGG CGGCGCTCGA ACTCGGGCTG 
GCCGGGGCGA GCCTGCGCGT CGCGGGCGGG GCGGTGCGCC TCGCGCTGGC GGGGGCGCCG 
AGCGGGCTGC GCCTCGATGG CGAGCCGCTC GCCGCGCACC GCTCCTTCGT CCTGCGCGAG 
GGCTCGGCGT TGACGATCGA GCGGCCGCGC GAGGGCGTGT TCGCCTATCT CGCGGCGGCC 
GGCGGCTTTC CCGTCCGCCG CGTGATGGGC AGCCGGGCGC TCCACCAGCG CGCGGCACTC 
GGCGGCCTTG ATGGGCGCGC ATGCCGCGAG GGCGATCGCC TGCCGCTCGC CGCCCCGGCC 
TCGGGTGAAG CGGACCACAG CCTCGATCCG ATCCCGCTGG AACGCGAGGC GCCGGTCCGC 
GTCGTCCTCG GGCCGCAGGA CGACCTGTTC CCGCAAGCCG GCCTCGCGAC GTTCTTGGCC 
GAGACCTTCA CGGTGTCGAA CCGGGCCGAC CGGATGGGCT ATCAGCTCGA CGGACCGGAG 
ATCGCCCATG GCGCGGGCGG CTTCAACATC GTCTCCGACG CCACCGTGGC CGGCTCGGTG 
CAGGTGCCGG GTTCGGGCCG TCCCATCGTC CTGCTCGCCG ACCGCCAGAC GACCGGCGGT 
TATCCGAAGA TCGCCACCGT GATCTCCGCC GACCTCAGGC GGATCGCCCA GCGCCGGCCG 
GGCGAGCCGG TGCGGTTCGG GGCGGTCGAT CTCGCCACCG CCACCCGGCT TGCCCGCGAG 
GCGGCGGTGC GGATCGCGGC CCTGGGCACC CGCCTCCGGC CGGTCGAGGG CGAGGTCGAG 
CGGCTGATGG CGGCCAACCT CGCGGGCGCA GCGGTGGACG CTTTGCGCGC GGAGGATTGA

Protein sequence

MSAHLHITRL TGAASLQDGG RRGFLRFGLS ASGPMDPLAF AAANRLVGNP ADAAALELGL 
AGASLRVAGG AVRLALAGAP SGLRLDGEPL AAHRSFVLRE GSALTIERPR EGVFAYLAAA 
GGFPVRRVMG SRALHQRAAL GGLDGRACRE GDRLPLAAPA SGEADHSLDP IPLEREAPVR 
VVLGPQDDLF PQAGLATFLA ETFTVSNRAD RMGYQLDGPE IAHGAGGFNI VSDATVAGSV 
QVPGSGRPIV LLADRQTTGG YPKIATVISA DLRRIAQRRP GEPVRFGAVD LATATRLARE 
AAVRIAALGT RLRPVEGEVE RLMAANLAGA AVDALRAED