Gene Mext_3914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3914
Symbol
ID	5835138
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	4349068
End bp	4350165
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	73%
IMG OID	641369705
Product	plasmid encoded RepA protein
Protein accession	YP_001641356
Protein GI	163853313
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.0766872
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGGGC TTGAGGCCAA GATCGCCGCG ATCCGTGACC CGGATCTGCA GGCGGAGCTG 
GAGGCGGCGC GGGGCGGGTT CCTGTTCGCG CCGATCGTCG AGCACCTGCT GTTCCGCCAG 
CGCGAGCGTG ACGCCGCCCG GGCCCAGGAG GGGGCGCAGG CCGAGGCCCG CGAGGCCATG 
GGCCGCGACC GCCGCCGCCG CGACGCCGTG CGCGAGGTGA TCGAGAGCGA GCCCACCGGC 
CCGGAAAACC TCCAGCACCT GCACTCGGTG CTGGCGCTCT GCGGCCTGCC CTACCGCGAT 
CCCGGTGATG CCCGCGACTT CGTGCGCGAA TACGGCCGCA ACTCGCTCAG CCTCTCGGCG 
GGGCGCCTCA AGAACCCGAT CACCGGCGAG ATGGAGCTGC AGGGCCTGCC CTACGGCCCC 
AAGGCCCGGC TCGTGCTGCT GCACCTCTGC ACCGAGGCGG TGCGCCAGCG CAGCCCGACC 
ATCGAGGTCG CCGACAGCCT CTCGGGCTTC ATGAAGGCGA TGGGGTTCGC CGTCACCGGC 
GGCGAGCGCG GCACCATCGG CGCCTTCAAG GAACAGCTCA ACCGGCTCGC CGCCTGCTCG 
ATGCAGCTCG GCCTGTGGGA CGGGGAGGGG CAGGCCTCGA CCCTCAACGT GCCGCCCTTC 
CGCCAGCTCG AATTGTGGCG GCGCGGCGAT GACGGCCTCG TCTGGCAGCG CACCGTCTCG 
TTCCATCAGG ATTTCTACGA CAGCCTGATC CGGCACGCCC TGCCGGTCGA TATCCGCGCC 
GCGCGGGCCT TCTCCGGCTC GGCGCGCAAG CTCGACCTCC TGTTCTGGAC CGGCTACCGC 
CTGCGCGCCC TGCAGCGCCC CCTGCGGCTG ACCTGGGACA ACCTGCACCG CCAGTTCGGC 
GCCGAGAACG CCAGCCTGCG CAGCTTCCGC CAGGCCTTCA AGGCGGATCT CGCCGGCCTG 
CTCGAAGTGT TTCCGCGGCT GCGGATCGAC CTCGACGAGG GCGGCATGCT GCTCCACCCG 
GCCGATCCCG GCAGCCTGCT GGTGCCGCCC AAGGCCGCCC GCACCGCGCG CGCGGCGGCC 
TCTGCGGCCC GCGCCTGA

Protein sequence

MSGLEAKIAA IRDPDLQAEL EAARGGFLFA PIVEHLLFRQ RERDAARAQE GAQAEAREAM 
GRDRRRRDAV REVIESEPTG PENLQHLHSV LALCGLPYRD PGDARDFVRE YGRNSLSLSA 
GRLKNPITGE MELQGLPYGP KARLVLLHLC TEAVRQRSPT IEVADSLSGF MKAMGFAVTG 
GERGTIGAFK EQLNRLAACS MQLGLWDGEG QASTLNVPPF RQLELWRRGD DGLVWQRTVS 
FHQDFYDSLI RHALPVDIRA ARAFSGSARK LDLLFWTGYR LRALQRPLRL TWDNLHRQFG 
AENASLRSFR QAFKADLAGL LEVFPRLRID LDEGGMLLHP ADPGSLLVPP KAARTARAAA 
SAARA