Gene Mext_1952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_1952
Symbol
ID	5833789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	2183698
End bp	2185080
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	68%
IMG OID	641367753
Product	ethanolamine ammonia lyase large subunit
Protein accession	YP_001639422
Protein GI	163851379
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4303] Ethanolamine ammonia-lyase, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.276589
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCTACC GCCACACCGT TGGCCCCCGC ACCCACGTCT TCGCCGATCT GGCGACGCTG 
ATGGCGAAGG CGACACCGGT GCGCTCCGGC GATTGTCTCG CGGGCATTGC CGCGGAATCG 
GCCGAGGAGA ACATGGCCGC GCGCTGGTGC CTCGCCGAGG TGCCGCTCAG GGAGATTCTG 
GCCCGTCCGC TGATCCCCTA TGACGAGGAC GACGTTACCC GCCTGATCCT CGACGACCAC 
GACGAGGCGG CGTTCGCCGA GATCGCCGCG CTGACGGTCG GGGATTTTCG CGAGTTTCTG 
CTGACCGCGT CCTCTGAGAC GCTCGCGCGG ATCGCGCCGG GCGTGACGCC GGAGATCGCC 
GCCGCGGTGT CCAAGATCAT GCGCAACCAG GATCTGATCC TGGTCGCGAA GAAGTGCCGC 
GTGGTCACCC GCTTCCGCAA CACGATCGGC CTGCCCGGCA CGCTCGCGGT GCGGCTCCAG 
CCCAATCACC CGACCGACGA CCCGGCGGGC GTCACCGCCT CGATCCTCGA TGGGCTCTCC 
TATGGCTGCG GCGATGCCGT GATCGGCATC AACCCGGTCT CCGATTCGAT CCAGACGATG 
GGCACCCTGC TGCGCCTGTT CGACGGCATC ATCGGCCGGC TGGAGATTCC GACCCAGGCC 
TGCGTGCTCA CCCACGTCAC CACCACGCTC GACGCGATGA ACCGGGGCCT GCCGGTCGAT 
CTGGTGTTCC AGTCGATCGC CGGGACGCAG CGGGCCAATG CGAGCTTCGG CGTCACCCTG 
CCGATCCTGC AGGAGGCGCA TGAGGCGGCG CTCGCGCTCA AGCGCGGCAC GCTCGGCGAC 
AACGTGATGT ATTTCGAGAC CGGCCAGGGT TCGGCCCTCT CGGCGGATGC GCATCACGGC 
ATCGACCAGC AGACCCTGGA GGCGCGGGCC TATGCCGTCG CCCGCCGCTA CCGGCCGCTT 
CTGGTCAACA CCGTTGTCGG CTTCATCGGG CCGGAATACC TCTACAACGG CAAGGAGATC 
ATCCGCGCCG GGCTGGAAGA CCATTTCTGC GGCAAGCTGA TGGGCGTGCC GCTGGGCGTC 
GACGTCTGCT ACACCAACCA CGCCGAGGCC GATCAGGACG ACATGGACAC GCTCCTGACC 
CTGCTCGGGG CGGCGGGCTG CACCTACGTG ATGGGCATTC CCGGCGCCGA CGACGTGATG 
CTGAACTACC AGTCCACCTC GTTCCACGAT CAGCTCTACA TCCGCGAGGT TTTGGGCCTG 
AGGCGCGCGC CCGAATTCGA GGAATGGCTC GCCCGTATCG GCCTCACCGA CGCGGACGGC 
GCACTCCTGC CCGGCGGGGC CGAGGCCCGC CTGCTCACCG CCGCGCCGGA GCTGGCCGCA 
TGA

Protein sequence

MPYRHTVGPR THVFADLATL MAKATPVRSG DCLAGIAAES AEENMAARWC LAEVPLREIL 
ARPLIPYDED DVTRLILDDH DEAAFAEIAA LTVGDFREFL LTASSETLAR IAPGVTPEIA 
AAVSKIMRNQ DLILVAKKCR VVTRFRNTIG LPGTLAVRLQ PNHPTDDPAG VTASILDGLS 
YGCGDAVIGI NPVSDSIQTM GTLLRLFDGI IGRLEIPTQA CVLTHVTTTL DAMNRGLPVD 
LVFQSIAGTQ RANASFGVTL PILQEAHEAA LALKRGTLGD NVMYFETGQG SALSADAHHG 
IDQQTLEARA YAVARRYRPL LVNTVVGFIG PEYLYNGKEI IRAGLEDHFC GKLMGVPLGV 
DVCYTNHAEA DQDDMDTLLT LLGAAGCTYV MGIPGADDVM LNYQSTSFHD QLYIREVLGL 
RRAPEFEEWL ARIGLTDADG ALLPGGAEAR LLTAAPELAA