Gene Mpal_0038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_0038
Symbol
ID	7270107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	36344
End bp	37633
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	64%
IMG OID	643568697
Product	diaminopimelate decarboxylase
Protein accession	YP_002465157
Protein GI	219850725
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0019] Diaminopimelate decarboxylase
TIGRFAM ID	[TIGR01048] diaminopimelate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCTCC CCCCACACTT CTCGATCAGG GGCGGCGATC TCTTTATCGA GGGACAGAAC 
TGCGTGGACC TGGCCGAGCA GTATGGCACC CCACTGTACG TGACCAGCGA GGACCGGATC 
CGAACGCAGA TGCAGGGTTA TCGGGACGCC CTCTCCTCGT ATTATTCTGA CATATCGGTG 
CTGTACGCGG CCAAGGCGAA CGGCAACCTG GCGGTCTTCC AGATCCTGGC CTCAGAAGGG 
GCTGGCGCCG ATGTCTTCTC ATCAGGGGAG GTGGCGCTGG CCCTGAAGGC CGGTATGGAC 
CCGCACAAGC TCCTCTTCAA TGGCAGTTCC AAGACCCTCA TGGACCTCGC CCTTGCGGTG 
GAGCTTGGGA TCCGGGTCTC GGTGGACTCG CTCGACGAGC TCCACCAACT CGACGCCGTG 
GCGGCTGAGG CCGGAAAGGT CGCCGAGATC GCGTTTCGGG TGAACCCGGC CCTCGAAGTG 
CCGACGCATC CCAAGATCGC CACTGGCCTC GCCTCCAGCA AATTCGGGAT CCCGCATCAG 
CAGATCCCGG CGGCCTATGC TGAGGCGCTC GCCTGCAGTA ACATAAAACC GGTTGGGATC 
CACTGCCATA TCGGCTCGCA GATCCTGGAC GTCACCCCCT TTGCGAAGGC GGCCGAGGTG 
ATGGTCAGGA TCGCCAGGGA GATCACCGAC CTCGGGATCA AGCTCGAGTT TCTGGACCTG 
GGCGGCGGCC TCGGGATCCC GTATAACCAC ACCTCCGAGA CGGCGCCGTC GCCGGCAGAG 
TACGCAGCAG CCGTAATGCC GGTATTTCTG GCCGGGATAA AAGAGTGCAA CATCCACCCA 
GAACTCTGGG TGGAGCCGGG GCGGTCCCTG GTCGCCGACT CGACGGTGCT GTTGGCCACG 
GTCAACTCGG TGAAGAAGGC CCACAAGACG TTCGTGAACG TGGACGCCGG GTTCAATCTG 
CTGATTCGGC CGGTGATGTA CGACTCCTAC CATGAGATCG TCGTGGCCAA CCGGGCCGAC 
CAGCCGATAG CCGGGACGTA CACGGTCGCC GGGCCGATCT GTGAGACCGG TGACCTGCTG 
GCGGTTGACC GGGCGCTGCC GGGCGTCCAG GAGGGCGACC TCGTCGCCGT GCTGGACACC 
GGGGCCTACG GGTTCTCGAT GTCCTCGCAG TACAACAGCC GGCCCCGGTG TGCCGAGGTG 
CTGATCCGGG GTGGGGATGC CGCCCTGATG CGCAGGGCAG AGACGGTCGA CGACCTGCTG 
GCCTCGATGG TCACCCCTCC CTGGCTCTAA

Protein sequence

MILPPHFSIR GGDLFIEGQN CVDLAEQYGT PLYVTSEDRI RTQMQGYRDA LSSYYSDISV 
LYAAKANGNL AVFQILASEG AGADVFSSGE VALALKAGMD PHKLLFNGSS KTLMDLALAV 
ELGIRVSVDS LDELHQLDAV AAEAGKVAEI AFRVNPALEV PTHPKIATGL ASSKFGIPHQ 
QIPAAYAEAL ACSNIKPVGI HCHIGSQILD VTPFAKAAEV MVRIAREITD LGIKLEFLDL 
GGGLGIPYNH TSETAPSPAE YAAAVMPVFL AGIKECNIHP ELWVEPGRSL VADSTVLLAT 
VNSVKKAHKT FVNVDAGFNL LIRPVMYDSY HEIVVANRAD QPIAGTYTVA GPICETGDLL 
AVDRALPGVQ EGDLVAVLDT GAYGFSMSSQ YNSRPRCAEV LIRGGDAALM RRAETVDDLL 
ASMVTPPWL