Gene Mext_1963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1963
Symbol
ID	5833667
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	2194677
End bp	2195789
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	72%
IMG OID	641367764
Product	phosphoribosylaminoimidazole carboxylase, ATPase subunit
Protein accession	YP_001639433
Protein GI	163851390
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0026] Phosphoribosylaminoimidazole carboxylase (NCAIR synthetase)
TIGRFAM ID	[TIGR01161] phosphoribosylaminoimidazole carboxylase, PurK protein

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.199721
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCTCTC CCACCTCCTC GCCGCAGATC CGGCCCGGCG GCACCCTCGG CATCGTCGGC 
GGCGGCCAGC TCGGCCGCAT GATCGCGCTC GCGGCAGCCA ATTACGGCCT CAAGGTGCAC 
ATCTACGCCC CCGATGCCGA CAGCCCGGCC TTCGACGTGG CCCATGCCCA CACGCTGGCG 
CCCTACGACG ACGCGGCGGC GCTGGCCGCC TTCGCCGATG CCTGCGACGT GGTCACCTAC 
GAGTTCGAGA ACATCCCCCA CGCCACCGCC GCCGTGCTCG CCGAGCACGC GACCCTGCGC 
CCGAGCGCGA CGGCGCTGCT CACGACGCAG GATCGCCTGT CCGAGAAGGA CTTCGTGACC 
TCGCTCGGCA TTCCGACCGC GCCCTACCGG GCGGTCGATA CGGTCGAGGA TCTCGTGCGG 
TCCCTGGAGG CGCTCGGCCG CCCCGCCGTG TTGAAGACCC GGCGCTTCGG CTACGACGGG 
AAGGGCCAGC GGATGATCCG CGAGGGCGAC GACCCGGCTG CCCTCCTCGC CGAGTTCAAG 
GGCGCGCCCT GCATCCTCGA AGGGTTCGTG CCGTTCGAGC GCGAAATCTC GGTGGTCGCC 
GCCCGCGGGC CGGACGGGAC CTTCGCGGCC TACGACCCCT GCGCCAACGA GCACCGCGAC 
CATATCCTTG CGCTCACCCG CGTGCCCGCT CCCGGCCTGA CCCGGACGAC GGGTGACGCG 
GCGGTCGCCA TCGCCCGCGC CATCGCCGAG GCGCTGGACT ATGTCGGGGT GCTTGCGGTC 
GAGATGTTCG AGATCGCCGG GCCCGAGGGG GCCGCCCGCC TCGTCGTCAA CGAGATCGCG 
CCCCGCGTCC ACAATTCCGG GCACTGGACC ATCGAGGGCG CGCTGACCTC GCAATTCGCG 
CAAACCGTGC GCGCGGTCTG CGGTTGGCCG CTCGGCGACA CCGCCCGCAC CGGCGGCATG 
GCGGTGGAGA TGGAGAACCT CATCGGCGCC GAGGCCGATG CCTGGGCGGA CCTGCTAGCG 
GAGCCGGGCG CCCATCTCCA CCTCTACGGC AAGGCCGAGG CCCGTCCCGG CCGCAAGATG 
GGGCACGTCA CCCGGCTCAA GCCGCTCGAC TAA

Protein sequence

MASPTSSPQI RPGGTLGIVG GGQLGRMIAL AAANYGLKVH IYAPDADSPA FDVAHAHTLA 
PYDDAAALAA FADACDVVTY EFENIPHATA AVLAEHATLR PSATALLTTQ DRLSEKDFVT 
SLGIPTAPYR AVDTVEDLVR SLEALGRPAV LKTRRFGYDG KGQRMIREGD DPAALLAEFK 
GAPCILEGFV PFEREISVVA ARGPDGTFAA YDPCANEHRD HILALTRVPA PGLTRTTGDA 
AVAIARAIAE ALDYVGVLAV EMFEIAGPEG AARLVVNEIA PRVHNSGHWT IEGALTSQFA 
QTVRAVCGWP LGDTARTGGM AVEMENLIGA EADAWADLLA EPGAHLHLYG KAEARPGRKM 
GHVTRLKPLD