Gene Mpe_A2157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2157
Symbol
ID	4785821
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	2312915
End bp	2314153
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	67%
IMG OID	640090725
Product	tryptophan synthase subunit beta
Protein accession	YP_001021348
Protein GI	124267344
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0133] Tryptophan synthase beta chain
TIGRFAM ID	[TIGR00263] tryptophan synthase, beta subunit

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.595682
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.092632
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGAATT ACCAGCAACC CGATGCGAGC GGCCATTTCG GCCGCTATGG CGGCAGCTTC 
GTCGCCGAGA CCCTGATCCA CGCGCTCGAC GAACTGAAGG CCGCCTACGC GCGCTATCGC 
GACGATCCCG AGTTCGTGGC CGAGTTCAAG AGCGAGCTCG CGCATTTCGT CGGCCGACCC 
AGTCCGATCT ACCACGCCGC GCGCATGAGC CGCGAGCTCG GTGGCGCCCA GATCTACCTG 
AAGCGCGAGG ACCTCAACCA CACCGGCGCC CACAAGATCA ACAACACCAT CGGCCAGGCG 
CTGCTGGCCC GGCGCATGGG CAAGCCGCGC GTGATCGCCG AAACCGGTGC CGGCCAGCAC 
GGCGTGGCCA CCGCCACCAT CTGTGCCCGC TACGGCATGG AATGCGTGGT CTACATGGGC 
AGCGAGGACG TGAAGCGCCA GTCGCCCAAC GTCTACCGCA TGCACCTGCT GGGCGCCAGG 
GTGGTGCCGG TGGACAGCGG CAGCAAGACG CTGAAGGACG CGCTGAACGA GGCGCTGCGC 
GACTGGGTCA CCAACGTCGA GAACACCTTC TACATCATCG GCACCGTGGC CGGCCCGGCG 
CCGTACCCGG AGATGGTGCG TGACTTCCAG AGCGTCATCG GCGAGGAATG CCTGCGGCAG 
ATGCCGGAGA TGGCGGGTCG CCAGCCCGAC GCGGTGATCG CCTGCGTCGG CGGCGGCAGC 
AATGCGATGG GCATCTTCTA CCCGTATATC CGACACGAGG GCGTGCGCCT GATCGGCGTG 
GAGGCGGCCG GACACGGGCT CGACTCCGGC AAGCATGCGG CCAGCCTCAG CGCCGGCTCG 
CCGGGCGTGC TGCACGGCAA CCGCACCTAC CTGTTGCAGG ACGCGAACGG CCAGATCATC 
GAGACGCACT CGATCTCCGC CGGACTCGAT TACCCCGGCG TCGGCCCTGA GCACGCCTAC 
CTGAAGGACA TCGGGCGGGC CGAGTACGTC GGCATCACCG ACGACGAGGC GCTGCAGGCC 
TTTCACCGGC TGTGCCGCAC CGAAGGCATC ATCCCGGCGC TTGAATCCAG CCATGCGGTG 
GCCTACGCGA TGAAACTGGC GCCGACGATG CGCAGCGACC AGAGTCTGCT GGTCAATCTG 
TCCGGCCGGG GCGACAAGGA CATCGGCACC GTTGCCGACC TGTCCGGCGC CGAGTTCTAC 
GACCGGCCGT CGTCGCGCGG CGAGAAGGTG AAGCAATGA

Protein sequence

MLNYQQPDAS GHFGRYGGSF VAETLIHALD ELKAAYARYR DDPEFVAEFK SELAHFVGRP 
SPIYHAARMS RELGGAQIYL KREDLNHTGA HKINNTIGQA LLARRMGKPR VIAETGAGQH 
GVATATICAR YGMECVVYMG SEDVKRQSPN VYRMHLLGAR VVPVDSGSKT LKDALNEALR 
DWVTNVENTF YIIGTVAGPA PYPEMVRDFQ SVIGEECLRQ MPEMAGRQPD AVIACVGGGS 
NAMGIFYPYI RHEGVRLIGV EAAGHGLDSG KHAASLSAGS PGVLHGNRTY LLQDANGQII 
ETHSISAGLD YPGVGPEHAY LKDIGRAEYV GITDDEALQA FHRLCRTEGI IPALESSHAV 
AYAMKLAPTM RSDQSLLVNL SGRGDKDIGT VADLSGAEFY DRPSSRGEKV KQ