Gene Mext_3386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3386
Symbol
ID	5835187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	3755270
End bp	3756610
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	74%
IMG OID	641369185
Product	hypothetical protein
Protein accession	YP_001640843
Protein GI	163852800
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.742104
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGCGG CTGGCTCGCG GCGGGCTGTG CGCGGTGTTG CTTGCGTCTC GGTCGGGCTG 
GCCGGCGCCC TGATGGCGGG GATCCTGCTC TCCGGCCCGG GCCGGACGAC CAGCCCGCGC 
GGGGCGATCG ATCCGGTCGG CGGCGGGCTC ACGACCCGCA CCGATCTCCA TGCGGCCGCG 
CCGGAAGCGC CCGCGACCCG CATCGTCCTC GGGCCCGGCG AGCACGACAT ACGCCTGTCC 
GGAGAGCTGA CCGAGGGGGC GGCCGAGCGG CTCGCCGGAC TGCTCGAGGC CCACCGCGCG 
GTCGAGCGCA TCCATCTCAC CAGCGAGGGC GGCTTGGTCG ATGAGGGCGC GGCCATCGGC 
GCGCTGATCG CGGAGCACGG CCTCGTCACC TACGTGCCGG ATTACTGCGT CTCCGCCTGC 
ACCCTGGCCT TCGTGCGCGG GCGCGAGCGG CTGGTTCTGG CGGAGGCCCG GCTCGGCTTC 
CACGCGCCCT ACGAAACCGG TCCGCTCGGC GTCGAGATCG CGGCCGACAG CGCGCCCGAA 
CGCGCCGCCT ACCTTGCGGC GGGAATCAGC GCCGATTTCG TCGATGCCGC CCTCCAAGTC 
CGGCCAGACG ACCTGATGAT CCCCGACACC GACACGCTGA TGAGGGCCGG CGTCGCCACC 
GGCCGGGTGG ATGCCTACCG CTTTCCCGAT TCCACCCTCG ACGACGGTGC CGACCCGGAG 
CGGGCTCGCA CCGTGATCCT GCGCGACGTG CCGCTGCTGG ATGCGGTGGA GGCCGACGCA 
CCGGGGACGA TCGCGCCGAT CGCCGCGTGG TACCTCGACG GCTATCGCCG GGGCCGCTCG 
GAGGGAGACG CCGTCGATGG TGTCCGCCGG TTGGCGGCGC AGGCCGTGAC GCGAAGCCTC 
GCCGAGGCCG ACCCGGCCGC CCTGACCGAT CTCGGCCGGA TGATCCTCCA GACGATGCAA 
CGTCCGAGCC TGGAGCGAAG GCGCATCTGC GCGTCGGCCG AGGACGGGGT GGGCGCCGTG 
CTGACGCGAT CACGCCTCGG CGCGGCACAA CTCGCCGAGG GACGGGCGAT CCTGTCGCGG 
GCGCTCGGGT TGAGGGCGAC GGAGGCGGCG CCCCAGCCCC TGCGGGAGGC TTCGACAAGT 
CAGGCCGCCA TCGCGGTGGC GACGGTGACG GCCCCACCAA AGCCGGCGCG CGGGCGCGGC 
TGCGCAGCCC TGCGAAAAGC CTTCGCGGCC GCCCTAGCCC GCCCCATGCC CGAGGCGGCG 
CAGGCCTTGC GCCCGCTGCT CTTCCCCGCG TCGCCGGCAC GCTCGCGCCC CGCGCTCGAA 
GCCTCCGCGC AACCGCGATA A

Protein sequence

MMAAGSRRAV RGVACVSVGL AGALMAGILL SGPGRTTSPR GAIDPVGGGL TTRTDLHAAA 
PEAPATRIVL GPGEHDIRLS GELTEGAAER LAGLLEAHRA VERIHLTSEG GLVDEGAAIG 
ALIAEHGLVT YVPDYCVSAC TLAFVRGRER LVLAEARLGF HAPYETGPLG VEIAADSAPE 
RAAYLAAGIS ADFVDAALQV RPDDLMIPDT DTLMRAGVAT GRVDAYRFPD STLDDGADPE 
RARTVILRDV PLLDAVEADA PGTIAPIAAW YLDGYRRGRS EGDAVDGVRR LAAQAVTRSL 
AEADPAALTD LGRMILQTMQ RPSLERRRIC ASAEDGVGAV LTRSRLGAAQ LAEGRAILSR 
ALGLRATEAA PQPLREASTS QAAIAVATVT APPKPARGRG CAALRKAFAA ALARPMPEAA 
QALRPLLFPA SPARSRPALE ASAQPR