Gene Mext_3081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3081
Symbol
ID	5835478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	3427981
End bp	3429519
Gene Length	1539 bp
Protein Length	512 aa
Translation table	11
GC content	72%
IMG OID	641368882
Product	CHAD domain-containing protein
Protein accession	YP_001640541
Protein GI	163852498
COG category	[S] Function unknown
COG ID	[COG3025] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.261828
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACC CGCGCGAGAT CGAGCTGAAG CTGGAATGCG AGCCCTCCGA CCTCGCCGTC 
CTGCAGGATC ATCCGCTCCT GCGGGAGGCG GCGGTCCAGG GGGAAGCCGA GCTCGCCTCC 
GTCTATTTCG ACACGCCGGA TCGGCAGCTG CACGCGGCCG GGCTCGGGCT GCGAGTGCGC 
GAGAGCGAGG GGCGCTTCGT CCAGACCCTC AAGGCCGAAG GCGATGGCCT GTTCGACCGC 
CCGGAATGGG AGCAGCCGGT CGAGGGCGCC GAGCCGGACC GGGCGGCGCT CGCCGACACG 
CCCTTCGCGC GCCGCGTCGC GGACGATGCC GCGCTGGAGC CGCTCTTCAC CAGCCGCGTC 
ACCCGGCGGA CCTACCTCGT CGAGCAGGGT GAGTCCCGCA TCGAGGTCGC CCTCGATCTC 
GGCCGGATCG AGTCGCCGGC CGCCGGCGAC GACATCCTGT CGATCTGCGA GATCGAGCTT 
GAACTGAAGG AGGGGACCGC GAGCGACGTG TTCGCGCTCG CCTACGCCAT CGCCGCCCTC 
GTGCCGGTGC GGCTCGGCGT GCGCAGCAAG GCCGAGCGCG GCTACGCCCT GGCCGCCGGC 
AAGATCGACC GGGTGCGCAA GTCGGAGCCG GTGCCGCTGC ATGACGACAT GAGCGCGGCG 
GAGGCGTTCC GCGCCGTCGC CCATGCCTGC CTGCGCCACA TGCGGATCAA CGAGGACATC 
CTGCTCAAGA GCCGCGACGC CGATGCGCTG CACCAGATGC GCGTCGCGAT CCGGCGCCTG 
CGCTCGGCCT TCTCGCTGTT CGGCGACCTC GTGGACGATC CGCTCGGCGT TCGCATCCGC 
GCGGAGCTGA AGGCGGCGAC CGAGCCGCTG GGCCGGGCGC GAAATCTCGA TGTCTTCCTC 
GCCACCATCC TGCCGGCCGA GCGCGAGCGC CATCCCGACG AGGTCGGCCT GCTCGGCCTC 
GAGCGGCAGC TCGAAGACGA GCGCGCGAAG GCCTATCGCG ACCTCGCCGC GCTGCTGCGC 
TCCGATGCGT GGCGGATGCT GCTGCTCGAC CTGATCGGCT GGATCAATGC CGGCCCCTGG 
CTGCGGGACG ACAGCCCCGG CCGCGTCTCC CTGCGCGAGG AGCCGGCCCG CGTCTTCGCC 
GCCCGCGAAC TCGACCGGCG GCGGCGGCAG GTGAAGCGGC GCGGGCGCCA TCTCGACGAC 
CTCGAGCCCG AGGAGCGCCA CCGGGTGCGC ATCGCCGCCA AGAAGCTGCG TTACGGCGCG 
GAATTCTTCG CGCCCCTGTT CCCCGGCAAG AAGGCGGGCA AGCGCCACGG CGCCTTCGGC 
AAGGCCCTCT CGGATCTGCA GGACCATCTC GGCGCGCTCA ACGACATCGC CACCGGCCAC 
GAATTGATGC GGGACCTGAG GGTCGAGCCG GCCGGCGCCA CGACCCTGTT CGCCGCCGGG 
ATGACGGCGG CCGATATCGA GGCGCGCAGC CGCAAGCTCT TGGAGGCGGC GGCCGAGGCG 
CACGAGGATC TCGTCGACAC CAAGCCGTTC TGGCGTTGA

Protein sequence

MSDPREIELK LECEPSDLAV LQDHPLLREA AVQGEAELAS VYFDTPDRQL HAAGLGLRVR 
ESEGRFVQTL KAEGDGLFDR PEWEQPVEGA EPDRAALADT PFARRVADDA ALEPLFTSRV 
TRRTYLVEQG ESRIEVALDL GRIESPAAGD DILSICEIEL ELKEGTASDV FALAYAIAAL 
VPVRLGVRSK AERGYALAAG KIDRVRKSEP VPLHDDMSAA EAFRAVAHAC LRHMRINEDI 
LLKSRDADAL HQMRVAIRRL RSAFSLFGDL VDDPLGVRIR AELKAATEPL GRARNLDVFL 
ATILPAERER HPDEVGLLGL ERQLEDERAK AYRDLAALLR SDAWRMLLLD LIGWINAGPW 
LRDDSPGRVS LREEPARVFA ARELDRRRRQ VKRRGRHLDD LEPEERHRVR IAAKKLRYGA 
EFFAPLFPGK KAGKRHGAFG KALSDLQDHL GALNDIATGH ELMRDLRVEP AGATTLFAAG 
MTAADIEARS RKLLEAAAEA HEDLVDTKPF WR