Gene Mext_1040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1040
Symbol
ID	5833392
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	1133159
End bp	1134484
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	73%
IMG OID	641366835
Product	cobyrinic acid a,c-diamide synthase
Protein accession	YP_001638516
Protein GI	163850473
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1797] Cobyrinic acid a,c-diamide synthase
TIGRFAM ID	[TIGR00379] cobyrinic acid a,c-diamide synthase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0318758
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCCCG CCCCCGGCCT CCTCGTCGCC GCGCCGCGCT CCGGCTCCGG CAAGACCACG 
GTGACGCTCG CGCTGATGCG AGCCTTGCGC CGCCGAGGCG TGGCGATCCG CGGCGCGAAA 
TGCGGGCCGG ACTACATCGA CCCCGCCTTC CACGAGGCGG CGACGGGCCT CCCCAGCCTC 
AACCTCGACA GCTTTGCCAT GCCGGACGCG CTGCTCGATG CCTGCGCCGG CCTGAGCGCG 
CGCGAGGCCG ATCTCGTCAT CGCCGAGGGC TCGATGGGCC TGCATGACGG TATCGTTGCG 
GGCGAGGGCC GCACCGGCGC CAACGCCGAC ATCGCCGCGC GCTACGGCTG GCCGGTGGTT 
TTGGTGCTCG ACGTGTCGGG TGCCGCGCAA TCGGCGGCGG CCGTGGCGCT CGGCTGCGCG 
GCCTACGATT CGCGAATCCG GATCGCGGGC GTGATCCTGA ACAAGGTCGC GAGCCCGCGC 
CACCGCCGTC TCGTCGAGGC AGGGCTGTCG CGGGTCGGCC TGCCGGTGCT CGGCGCCTTC 
CCGCGCGAGG CGAGCCTCGT CCTGCCCGAG CGCCATCTCG GCCTCGTCCA GGCCGGCGAG 
ACCGCCGACC TCTACGCCCG CCTCGACCGG CTCGCCGATC TCGCGGAAAC CTCCCTCGAC 
CTCGACGCGA TTCTTGCCGT GGCCGGCGGG CACGCCCCCA TCGCCACCGA CGGCCTGCCG 
AGGCCGCCGG CGCAGCGGAT CGCAGTGGCG CGGGATGCCG CCTTCTCGTT CCTGTATCCG 
CACATGCTGG CCGGCTGGCG CGCGGCCGGC GCCGAGATCG TGCCGTTCTC GCCGCTGGCT 
GACGAGGCGC CGGGGATCGA TTGCGACGCT TGCTGGCTGC CCGGCGGCTA CCCCGAACTG 
CATGCGGGCC AGCTCGCGGC AGCGCAAAGC TTCCTCGGCG GCTTACGCGA CTTCGCGCAG 
ACGCGGCCGG TCCATGGCGA GTGCGGCGGC TACATGGTTC TGGGCGAGAG TCTGGAGGAT 
GCGGACGGGC TCACCCATCC GATGTGCGGG CTGCTGCCGG TCGCGACCTC GTATCGGCGG 
CGCAAGCTCC ATCTCGGCTA CCGCGTCGCG CATCTCCTCG ACGACGGGCT GCTCGGCACC 
GCCGGCACGC GCCTCGTCGG GCACGAGTTC CACTACGCGA GCGAACTCAC GCCGGCCCCG 
GGGGACGAAA TTGCGCTGGC GCGGGTGACG GATGCGGAAG GGGTGCCGCT CGGCCTCGCC 
GGCCACCGCC GGGGCCGCGT CACGGGCAGC TTCTTCCACC TGATCGCCGG GACGGCCGAA 
GCGTGA

Protein sequence

MTPAPGLLVA APRSGSGKTT VTLALMRALR RRGVAIRGAK CGPDYIDPAF HEAATGLPSL 
NLDSFAMPDA LLDACAGLSA READLVIAEG SMGLHDGIVA GEGRTGANAD IAARYGWPVV 
LVLDVSGAAQ SAAAVALGCA AYDSRIRIAG VILNKVASPR HRRLVEAGLS RVGLPVLGAF 
PREASLVLPE RHLGLVQAGE TADLYARLDR LADLAETSLD LDAILAVAGG HAPIATDGLP 
RPPAQRIAVA RDAAFSFLYP HMLAGWRAAG AEIVPFSPLA DEAPGIDCDA CWLPGGYPEL 
HAGQLAAAQS FLGGLRDFAQ TRPVHGECGG YMVLGESLED ADGLTHPMCG LLPVATSYRR 
RKLHLGYRVA HLLDDGLLGT AGTRLVGHEF HYASELTPAP GDEIALARVT DAEGVPLGLA 
GHRRGRVTGS FFHLIAGTAE A