Gene Mext_3032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3032
Symbol
ID	5835501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	-
Start bp	3378046
End bp	3379698
Gene Length	1653 bp
Protein Length	550 aa
Translation table	11
GC content	70%
IMG OID	641368832
Product	threonine dehydratase, biosynthetic
Protein accession	YP_001640492
Protein GI	163852449
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1171] Threonine dehydratase
TIGRFAM ID	[TIGR01124] threonine ammonia-lyase, biosynthetic, long form

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.08767
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGGAT CCGGCTCTGA CGGTGCGGCC CCTTCCCTCG CCTCCCGCCC TCGCATCCCG 
GCCGCGGAAG GACTAAGTCC CGGGCGTGCC CTGCCCGATG ACGCGGCCGA AAGCCTGCCC 
GTGACCGACT ACATCAAGAA GATCCTCTCT GCCCGCGTCT ACGACGTGGC GATCGAGAGC 
CCCCTCGATC CGATGCCCCG CCTGACGAAG CGGCTCGGCC GTCCCGTGCT GCTCAAGCGC 
GAGGATCTGC AGCCGGTCTT CTCGTTCAAG CTGCGCGGCG CCTACAACAA GATGGCCTCG 
CTGCCCCAAG AGCGGCTCGA GAGCGGCGTG ATCTGCGCCT CGGCCGGCAA CCACGCGCAG 
GGCGTGGCGC TAGCGGCGGC CAAGCTCGGC GTGCGGGCGG TGATCGTGAT GCCGCGCACG 
ACGCCCGCGA TCAAGGTCGA TGCCTGCCGG GCCCGCGGCG CCGAGGTCGT GCTGCACGGC 
GACGCCTTCG ACGAGGCTCT GGCGGAGGCT CGGCGCCTCG AAGCGCAGTG GGGCCTGACC 
TTCCTGCACC CGTTCGACGA TCCCGAGGTG ATCGCCGGAC AGGGTACGAT CGGCATGGAG 
ATCCTGCATC AGCATACCGG ACCGATCGAG GCGATCTTCG TGCCGATCGG CGGCGGTGGC 
TTGGCCGCCG GCATCGCCAC CTTCGTGAAA TATCTGCGCC CCGAGACCAA GGTGATCGGC 
GTCGAGCCGG ACGACGCCGC CACCATGTCC GAGGCGCTCC GGGCGGGCGA CCGGGTGATG 
CTGCCGAGCG TCGGGCTGTT CGCCGACGGC GTCGCGGTGC GGCAGGCCGG CGAGGAGACG 
TTCCGGCTCT GCCGCGAGCA TCTCGACGCG GTCATCACCG TCGATACCGA TGCGATGTGC 
GCCGCGGTCA AGGACATCTT CGACGACACC CGCGCGATCT CCGAGCCGTC GGGCGCACTG 
AGTCTGGCCG GCGCCAAGGC CTGGTCAGCG AAGAATCCCG GTGCCGGGCC GCTGGTGGCG 
ATCTCGTCGG GTGCCAACCT CAACTTCGAC CGCCTGCGCC ACATCGCCGA GCGGGCGGAG 
ATCGGCGAGG AACGCGAGGT GCTGCTCGGC GTCACCATCC CCGAACGGCC GGGCGCCTAC 
CGTGCCTTCA TCGGCGCGCT CGGGCCCCGC GCGATCACCG AATTCAACTA CCGCTACGCG 
CAAGGCAGCG ACGCGCGCAT CTTCGTCGGC ATCAACCTGC CCGGCGGCAA GCCCGAGAAG 
CGCGACCTGA TCGCCGCCCT GGAGAGCGCC GGCTACCGCG TCGCCGATAT GAGCGACAAC 
GAGATGGCCA AGGTGCATGT CCGCTACATG GTGGGCGGCC GCGCGGCGGG GCTCGCCGAC 
GAGCGGCTCT ACCGCTTCCA GTTCCCCGAG CGGCCGGGCG CGCTGATGAA GTTCCTCGAA 
GCGCTCGGCG ACGGCTTCAA CATCAGCCTG TTCCACTACC GCAATCACGG CGCCGATTAC 
GGCCGTGTGC TCGCGGGGAT CGAGGTGCCG GCAGCGGAGC GCGCCCGCTT CGAGGCCGCC 
CTCGAAGCGC TCGCCTATCC CTATGTCGAT GAGACCGACA ACCCGGCTTA CCGGCTGTTC 
CTCGACAACG GCATCGGAGC GGCCGACCAC TGA

Protein sequence

MPGSGSDGAA PSLASRPRIP AAEGLSPGRA LPDDAAESLP VTDYIKKILS ARVYDVAIES 
PLDPMPRLTK RLGRPVLLKR EDLQPVFSFK LRGAYNKMAS LPQERLESGV ICASAGNHAQ 
GVALAAAKLG VRAVIVMPRT TPAIKVDACR ARGAEVVLHG DAFDEALAEA RRLEAQWGLT 
FLHPFDDPEV IAGQGTIGME ILHQHTGPIE AIFVPIGGGG LAAGIATFVK YLRPETKVIG 
VEPDDAATMS EALRAGDRVM LPSVGLFADG VAVRQAGEET FRLCREHLDA VITVDTDAMC 
AAVKDIFDDT RAISEPSGAL SLAGAKAWSA KNPGAGPLVA ISSGANLNFD RLRHIAERAE 
IGEEREVLLG VTIPERPGAY RAFIGALGPR AITEFNYRYA QGSDARIFVG INLPGGKPEK 
RDLIAALESA GYRVADMSDN EMAKVHVRYM VGGRAAGLAD ERLYRFQFPE RPGALMKFLE 
ALGDGFNISL FHYRNHGADY GRVLAGIEVP AAERARFEAA LEALAYPYVD ETDNPAYRLF 
LDNGIGAADH