Gene Mpal_0003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_0003
Symbol
ID	7270115
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	2211
End bp	3377
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	60%
IMG OID	643568662
Product	aminotransferase class I and II
Protein accession	YP_002465122
Protein GI	219850690
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00871395
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGAAGGATC GGATATCTGA ACGGGCCCGG GTGATCCCAC CGTCAGGGAT CAGGAAGTTC 
TTTGATATCG TCCAGACGAT GGACGAAGTG ATCTCACTCG GTGTCGGCGA GCCGGACTTT 
GTGACCCCCT GGAACATTTG TGAGGCCGCG ATCTACTCGA TCGAGCAGGG GAAGACCTCG 
TACACCTCGA ACCGGGGGCT TCAGAACCTC CGCGAGGCCC TTGCGGCACG GATGGAGCGG 
GTATATGCCC TCCAGTACCA CCCTGACCGG GAGATGATTA TCACCACCGG CGTGAGCGAA 
GGGGTTGATA TCGCGGTCCG CGCGATCGTC GACCCGGGTG ACGAGGTGTT GATTGCAGAG 
CCGAGCTATG TTTCGTACGC TCCCACAGTG ACCCTGACCG GTGGGGTTCC GATATCAGTG 
GAGTGTCGAG AGGCAGATCG GTTCAAGCTG AACCCCGATA CCCTCGCCGA AGCGATAACA 
CCGAAGTCCA AGGCCCTGAT CATCAACTTC CCGACCAACC CGACCGGAGC CGTGATGACC 
AGGTCCGACT ACCGGGAGAT TGCCGATCTG ATCACCGACC ATGACCTTAT CCTGATCAGC 
GACGAGGTCT ATGCCGAGCT GACCTATGAA GGGACGCATG TCCCTGCGGC CACGGTCGGT 
GACCTCTGGG AGCGGACGAT CACGCTGAAC GGTTTCTCCA AGGCCTACGC GATGACTGGC 
TGGCGGCTCG GGTACCTCTG CGCTCCAGAA GATCTCTGCG ATGCAGCCTT GAAGATCCAC 
CAGTATGTGA TGCTCTGTGC TCCGATTATG GCCCAGATGG CGGCGAATGA GGCTATTCGA 
TCTGCAGAGG AGGAGAAGGA CGCGATGATC AAAGAGTACC GGCAGCGGCG GAACCTCTTC 
GTCGAGGGGT TGAATCATAT CGGCCTCCAC TGCCATCTGC CGGAGGGTGC GTTCTATGCG 
TTCCCGTCTA TTGCCTCCAC CGGCCTTTCG GACGAGGACT TCGCCGAGCA GTTGCTGCAT 
GAGCAGCATG TGGCGGTCGT CCCGGGATCG GTCTTCGGGG CTGGCGGAGT TAACCATATC 
CGCTGCGCCT ATGCGGTCTC ACGGCCGGAC CTGACCGAGG CGGTCAGACG GATCGGTCTC 
TTCATCGCTG ACCACCAGCG GGCTTGA

Protein sequence

MKDRISERAR VIPPSGIRKF FDIVQTMDEV ISLGVGEPDF VTPWNICEAA IYSIEQGKTS 
YTSNRGLQNL REALAARMER VYALQYHPDR EMIITTGVSE GVDIAVRAIV DPGDEVLIAE 
PSYVSYAPTV TLTGGVPISV ECREADRFKL NPDTLAEAIT PKSKALIINF PTNPTGAVMT 
RSDYREIADL ITDHDLILIS DEVYAELTYE GTHVPAATVG DLWERTITLN GFSKAYAMTG 
WRLGYLCAPE DLCDAALKIH QYVMLCAPIM AQMAANEAIR SAEEEKDAMI KEYRQRRNLF 
VEGLNHIGLH CHLPEGAFYA FPSIASTGLS DEDFAEQLLH EQHVAVVPGS VFGAGGVNHI 
RCAYAVSRPD LTEAVRRIGL FIADHQRA