Gene Mpal_1207 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1207
Symbol
ID	7271485
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	1240875
End bp	1242347
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	56%
IMG OID	643569844
Product	homoserine O-acetyltransferase
Protein accession	YP_002466268
Protein GI	219851836
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0517] FOG: CBS domain [COG2021] Homoserine acetyltransferase
TIGRFAM ID	[TIGR01392] homoserine O-acetyltransferase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0144114
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGAGAG GCTCAGTAGG GATCAGTACC ACCTCAACCT TTACCCTTGC CACACCCCTC 
CTACTGGAGA GTGGTGCTTC ACTGTTCTCC GTTCAGATTG CGTACGAGAC CTATGGAACG 
CTGAACCATG ATAAGAGCAA TGCAATCCTG GTCTGTCATG CCCTGACTGG TGACGCCCAT 
GCAGCAGGCC ACCATGGGGA CGAGTCACGT CCTGGCTGGT GGGACGGGGT GATCGGCCCG 
GGAAAGGCCT TCGATACGGA TAAGTATTTT GTGATCTGTT CGAACGTCCT CGGGGGCTGT 
AAGGGGACGA CCGGGCCGGC ATCACAAAAT CCTGATACAG GAAAACCCTA CGGCACCTCA 
TTCCCGGTAG TGACGATTCG GGACATGGTG AACGTACAGA AGGCACTGAT CGATCACCTG 
GGCATCAGCC AGCTCTTTGC AGTCGCCGGC GGATCGATGG GAGGCATGCA GGTGCTGCAG 
TGGATGGTCT CCTATCCATC GATGGTCAGG AAGGCGATCG CCATAGCGGC AACAGGGTCT 
TCAACCCCAC AGCAGATCGC GTTCAACGAA GTAGGAAGGA AGGCGATCAC TGCCGACCCT 
GCATGGTGTG GTGGTGACTA CTATGGAAAG GAGCACCCGG TGAAGGGGCT TTCGCTCGCA 
CGGATGGTCG CCCATATCAC CTACCTGAGC GATGCTTCAA TGCACACCAA GTTCGGACGG 
GCCCTGCAGG ACCGGGAGTT CAGAGGGTTC GACTTCGACA CCGAATTTCA GGTCGAGAGT 
TATCTGCACC ACCAGGGCAC CTCTTTCACC AAACGGTTCG ATGCGAACTC ATACCTGTAT 
CTGACCAAGG CTGTCGACTA CTTCGATCTC TCCGTCGACG ACTCGTTGAT CAGCGGGTTC 
GCTCCAACGA AAGCGACGGT GCTGATCATA TCGGTCACCT CGGACTGGCT GTACCCACCG 
TATCAGTCAC AGGAGATCGT ATCGGCCCTC TCGGCCAACG AATGCGATGT TCATTACTGC 
GAACTCCGCT CCCAGTTCGG GCATGATGCG TTCCTGATTG AGACCGGGCA ACTCAACTAC 
AGTATCAGTA GATTCCTCGA CCACACCCTG GTCAGGGATG TGATGAACAC ACAGGTGCCG 
GTGATCAGCG AGCAGTCGAC GATCGCTGTC GCTGCCCGGA TGATGATCAC ACAGGGAGTG 
AACCACCTCC CGGTTCTCGC CCCGGATCAG AGTCTAGTTG GGATTGTGAC CTCATGGGAT 
ATCGCAAACG CGGTAGCCTG CGGATATACC AGCCTCGATC AGATCATGTC CTCACAGGTG 
ATCACAACAA CAGGAGACGA GACGATCGAG GTGGCCGCAT CCCGTATGGA GCAGCATCGG 
ATATCAGCCC TCCCGGTGAT CGACCAGGCA CAGCATGTGA TCGGACTAAT CTCAAGCGAT 
GGACTCAGCA AGTTGATCGG TAGGGGTCCA TAA

Protein sequence

MQRGSVGIST TSTFTLATPL LLESGASLFS VQIAYETYGT LNHDKSNAIL VCHALTGDAH 
AAGHHGDESR PGWWDGVIGP GKAFDTDKYF VICSNVLGGC KGTTGPASQN PDTGKPYGTS 
FPVVTIRDMV NVQKALIDHL GISQLFAVAG GSMGGMQVLQ WMVSYPSMVR KAIAIAATGS 
STPQQIAFNE VGRKAITADP AWCGGDYYGK EHPVKGLSLA RMVAHITYLS DASMHTKFGR 
ALQDREFRGF DFDTEFQVES YLHHQGTSFT KRFDANSYLY LTKAVDYFDL SVDDSLISGF 
APTKATVLII SVTSDWLYPP YQSQEIVSAL SANECDVHYC ELRSQFGHDA FLIETGQLNY 
SISRFLDHTL VRDVMNTQVP VISEQSTIAV AARMMITQGV NHLPVLAPDQ SLVGIVTSWD 
IANAVACGYT SLDQIMSSQV ITTTGDETIE VAASRMEQHR ISALPVIDQA QHVIGLISSD 
GLSKLIGRGP