Gene Mext_3397 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3397
Symbol
ID	5835370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	3767307
End bp	3768725
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	74%
IMG OID	641369196
Product	sporulation domain-containing protein
Protein accession	YP_001640854
Protein GI	163852811
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0891472
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGGAC ACGCTTCGCG CGCGACGGTC GACTTCGATG CCTTCGAGCG CGAGCTGCGT 
CAGACGTCGC AGGAGGCGAT CCGGGCGAAG GCGCCGCAGG CCGCCCCCAA GGGCGCACCC 
AAGGGCGACC CGCTCGCCGA GCTTGCCCGC ATCGTCGGGC AGGACGATCC CTTCCGCGCC 
CTGCTGGAAG CGCGGGAGAA GGGTGCCGCC CAGGAGGCGG CTCCGGTGAC GCGCGCATCG 
GAGACGGGCC GTCCGGCCCG CGTCGAGCCG ACCTTCGTGG ACGAACCCGC CCACGACCCG 
GCCCGGACTC AGGCGCATGC CGACATGCAC GGTCAGTCCC AGAGCCCCGC GGACGCCTTC 
GACCAGTATC TCGCCTCCGT CGAGCAGGGC ATGTACGCCG ACGGCACGAC CGATCCGGCG 
GCCTTCGCCG AGGCCGACGA GACTTACCGG ACGCGGTCTG CGGACCGTCC GCGCGGCCGC 
AACCGCCTCG TCCAGGTCGG CGCCGGCCTC GCCGTGGTCG CCGTCTGCGT CGGCGGCGCC 
CTGGCGTGGC GTGGCACCCA TGGCGGCGGC AGCGGCGGCC CGATCACCGT GCTCGCCGAC 
AAGACCCCGC TGAAGGTGCA GCCGACTGCG ACCGACGGCG TCGAGATTCC CGACCAGAAC 
AAGCAGATCT ACGACCGCAA CGCCAAGGAC GGTCAGATCA AGATCGTCAA CCGCGAAGAG 
CAGCCGCTCG ACGTCAACCA AGCCGCCCGC TCCGCGGCCG CCCGCAGCGA CGGCGGCGAG 
CCGGGGCAGG GCGGGGCGAC CCCCGGCGGC ACCTTGTCCG ACACGTTCGG CGAGCCGCGC 
CGGGTGCGGA CCGTCTCGGT CAAGCCGGAC ACCCCGGTCC ACCAGCCGCC GGCGCCCCCG 
GCCGAGACCG CCCAGGCTCC TGCCTCGGCA ATCCCGACCA TGACGATGCC CGACACCGCT 
GCGAGCACCG CAACGCCGTC GTCGGAGCCC CGTCGCTCCG CGTCGCGCAC CCTGGCCACG 
GCGCCGGCGA CCACGCCCGT CGCCGAGGCA CCGGCGGAGC CGCCGGCCGC GCCCGCCGCG 
CGCCCGAAGG CCCCGCAGCG CGTCGCCTCC GTCTCGCCCG AGACCACCGC CAGCACCTCC 
GAGCCCGCCC CCACCACCGC TTCGCTCACG GCGCCGGTCA GCGGCTACTC GGTCCAGCTC 
GGCGTGCGCG GAAGCGAGAG CGAGGCGCGG GCCGCCTTCC GCGAGATGCA GGGCAAGTAC 
AGCCAGCTCT CCGGCAAGCC CGAGCTGATC CGGCAGGCCG AGGTGAACGG CAAGACCCTG 
TTCCGCGTCC GCGTCGGGCC GCTCGCCAAG AACGAGGCCT CCAGCCTGTG CAGCGCGCTG 
CAGGGCGCGG GCGGCCAGTG CTTCGTCGCC AAGAACTGA

Protein sequence

MTGHASRATV DFDAFERELR QTSQEAIRAK APQAAPKGAP KGDPLAELAR IVGQDDPFRA 
LLEAREKGAA QEAAPVTRAS ETGRPARVEP TFVDEPAHDP ARTQAHADMH GQSQSPADAF 
DQYLASVEQG MYADGTTDPA AFAEADETYR TRSADRPRGR NRLVQVGAGL AVVAVCVGGA 
LAWRGTHGGG SGGPITVLAD KTPLKVQPTA TDGVEIPDQN KQIYDRNAKD GQIKIVNREE 
QPLDVNQAAR SAAARSDGGE PGQGGATPGG TLSDTFGEPR RVRTVSVKPD TPVHQPPAPP 
AETAQAPASA IPTMTMPDTA ASTATPSSEP RRSASRTLAT APATTPVAEA PAEPPAAPAA 
RPKAPQRVAS VSPETTASTS EPAPTTASLT APVSGYSVQL GVRGSESEAR AAFREMQGKY 
SQLSGKPELI RQAEVNGKTL FRVRVGPLAK NEASSLCSAL QGAGGQCFVA KN