Gene Mext_1550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1550
Symbol
ID	5832489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	1731040
End bp	1732464
Gene Length	1425 bp
Protein Length	474 aa
Translation table	11
GC content	67%
IMG OID	641367348
Product	Alpha,alpha-trehalose-phosphate synthase (UDP-forming)
Protein accession	YP_001639020
Protein GI	163850977
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0380] Trehalose-6-phosphate synthase
TIGRFAM ID	[TIGR02400] alpha,alpha-trehalose-phosphate synthase [UDP-forming]

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCACGTC TGATCATCGT CTCCAACCGT GTCGCCGTAC CCGCCGAGGG TAAGGATGCG 
GTCTCCGCAG GGGGACTCGC CGTCGCGGTC AAGGAAGCTT TCTCCTCCTA CGAGGGGTTG 
TGGTTCGGTT GGAGCGGCAA CATCCGCGAC AACCCGAGCA CCGAGCCGGA ACTGATCGAC 
CGCGGGTCGA TCCAGTACGC CGTCCTCGAC CTGTCGCCGC AAGACCATCG CGAGTACTAC 
GCCGGCTTTG CCAACCGGGC GCTCTGGCCG ATCATGCATT ACCGGATCGG GCTGGGGACG 
TTCTCCCGCT CGGATTATGC CGGCTACCAG CGCGTCAACC AGACCTTCGC CCAGGCGCTC 
GCCAAATTGG TCGAGCCGGA CGACCTGATC TGGGTGCACG ACTACCACCT GCTGCCGCTG 
GCGAGCGAGC TGCGCGGCCA GGGCATCGCC AACCCGATCG GCTACTTCCA CCACATCCCG 
TGGCCCGCCG CCGACGTGTT CAACACCCTG CCCGCCAGCA ACGAGCTGCT GCGCGCCATG 
GCCGATTACG ACCTAATCGG ATTGCAGACC GATTCGGACG TGCAGAACCT CTCGCGCAAC 
TTCATCGACA CGATGCGGGC GATCCCGCTC GGCGGCGGCT CGATGATGGT GGACGGGCGG 
CGCACGCGAA TCCGCTCCTT CCCCATCGGC ATCGATGTCG CCAGCTTCAA GGAGGCCGCC 
GACAAGGCCG GCTCCAACAA GGTGGTGCGG GAGACCATGG CGGGCCTGCG CACCCGCAAG 
CTGCTCATCG GCGTCGATCG GCTCGACTAC TCGAAGGGCG TGCCCGAGCG CATGGAGGCG 
GTGGACCGCT TCTTCGCCTC GAATCCGGAT CAGCGCGGCA ACGTCGTCTA CATCCAGATC 
ACGCCGAAAT CCCGCAGCGA GGTGCCGGAA TACGAACAGC TCTCGCGCGA GGTGAACGAG 
AAGGTCGGCG ACATTAACGG CATGCTCGGC GAGCCGGCCT GGACGCCGAT CCAGTACGTC 
ACCAAGGCCT ATCCCCGCCC GGTCCTCGCC GGTCTCTACC GGGCCGCCCG CGTCGGCCTC 
GTCACGCCGA TGCGCGACGG CATGAACCTT GTGGCCAAGG AATACGTCGT CGCCCAGAGC 
GAGGAGGATC CCGGCGTCCT CGTCCTCTCG AAATTCGCGG GTGCGGCCCG GCAGTTGCCC 
GAGGCGCTGC TGGTGAACCC CTACGACCGC TTCGAGGTCG CCGAGGCGAT ACGGCAGGCG 
CTCTACATGC CCCGCGGCGA GCGCCTGGAG CGCTGGAAGC CGATGGCGGA CCGCATGCGG 
CGCGAAGACG TGGATTGGTG GGCCCGCTGC TTCATGGTGG AGCTGGAGAC CTTCCGCACC 
GTCGAGCGCG AGCCGCCGAG CACGACGGCG GCGGCGGCGG AGTAG

Protein sequence

MARLIIVSNR VAVPAEGKDA VSAGGLAVAV KEAFSSYEGL WFGWSGNIRD NPSTEPELID 
RGSIQYAVLD LSPQDHREYY AGFANRALWP IMHYRIGLGT FSRSDYAGYQ RVNQTFAQAL 
AKLVEPDDLI WVHDYHLLPL ASELRGQGIA NPIGYFHHIP WPAADVFNTL PASNELLRAM 
ADYDLIGLQT DSDVQNLSRN FIDTMRAIPL GGGSMMVDGR RTRIRSFPIG IDVASFKEAA 
DKAGSNKVVR ETMAGLRTRK LLIGVDRLDY SKGVPERMEA VDRFFASNPD QRGNVVYIQI 
TPKSRSEVPE YEQLSREVNE KVGDINGMLG EPAWTPIQYV TKAYPRPVLA GLYRAARVGL 
VTPMRDGMNL VAKEYVVAQS EEDPGVLVLS KFAGAARQLP EALLVNPYDR FEVAEAIRQA 
LYMPRGERLE RWKPMADRMR REDVDWWARC FMVELETFRT VEREPPSTTA AAAE