Gene Mlab_1304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlab_1304
Symbol
ID	4794380
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanocorpusculum labreanum Z
Kingdom	Archaea
Replicon accession	NC_008942
Strand	-
Start bp	1328725
End bp	1330287
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	54%
IMG OID	640099986
Product	hypothetical protein
Protein accession	YP_001030739
Protein GI	124486123
COG category	[B] Chromatin structure and dynamics [K] Transcription
COG ID	[COG1243] Histone acetyltransferase
TIGRFAM ID	[TIGR01211] histone acetyltransferase, ELP3 family

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGAGC ACACCATTTA TCGTGAGCTT ATCTCACTCA TTTTTTCCGA TCCGAACCCG 
GATATTCAGC ACATCAAACT TTCCGTGTGC CGTAAGTATT CTCTCGATGC GATGCCGAAA 
AATTCCGCGA TTCTCGCCGC CGCAAAACCC GAGGAGTACG AGGCCCTTCG TCGCGTTCTG 
ATGGTCAAAC CGACACGAAC ACTCTCAGGC GTCGCTCCGG TCGCGGTGAT GACGTCTCCT 
TGCGCCTGTC CGCACGGAAA ATGTCTGCCG TGCCCCGGAG GACCTGATCA CATATTCAAA 
TCACCCCAGA GTTACACCGG AGAAGAACCG GCGGCTCTGC GTGCCCGTCA GAATGAGTAT 
GATCCGTACC GTCAGGTGAC CGCAAGACTT GGGCAGTTCA AACTTCTCGG ACACCATGTC 
GATAAAGCCG AGCTGATCGT GATGGGGGGG ACGATGACCG CCCGGGACGC TGCATATCAG 
GAATGGTTCG TTTCCGAATG TCTGCGGGCG ATGAACGAGT TCTCCGGACA AAAATCCACC 
GCGGGATCGG TGGAAGAGCT GATGCTCGAG AACGAAAAAG CCGATGTCCG CTGTATCGCG 
ACAACCTTCG AGACCCGTCC CGACTGGTGT CGGGAGGAAC ATATCAATAA GATGCTTGAA 
CTGGGCGTGA CCAAAGTCGA ACTCGGGTTC CAACACACCG ATGATGAACT CCTGCTGTTA 
AACAAACGCG GCCACACGGT TGCTGACAGC GTTTTGGCAA ACACGCTCCT TCGGGATGCC 
GGCATCAAAG TCGGCTTTCA TGTTATGCCG AATCTGTACG GAAGCACGAT TCCGCGTGAC 
CGGGAGATGT TCGATACGCT CTTCACCGAC CCAAGATTTT GTCCGGATTT TCTAAAGATC 
TATCCAACAT TGGTCACCCC CGGCGCAGAA CTCGAAGAAC TCTGGCAAAA GGGAGAATAC 
AAAACATATG ACGAGGATGA CCTTGTCGAT CTCCTCGCCT ACGCAAAAAG CAGGCTTCCT 
CCCTATGTCA GACTTCAGCG TATCCAGCGG GATATTCCTG CAAAACTCAT CGTCTCCGGT 
TCGATTCACG GGCACATACG TCAGATGGCT GCTGAAAGAC TCAAAGAACA GGGAGGGAGC 
TGCCAGTGTA TCCGGTGTCG GGAGATCGGT CGCCGCCCGA GTTCTGCCGT GGATGAGGAG 
AAGACCCTCG TGTATCCTTG CTGTGGGGGG ACAGAACATT TCCTTTCGAC CACTGCCGGA 
GAATCACTGA TCGGTTTTGT TCGTCTGCGG TTTCCCGGAA CCGTATTCAG ACCGGAGCTC 
GACGGTGCGG CTCTCGTTCG AGAACTCCAC GTGTACGGCG AAATCGTCCC TCTCGGTGTG 
CATGGGTCAG GAGAGAAGCG TCAGCACAGA TCCTACGGTC AGCAGTTATT GTCGCGTGCC 
GAAGAAACTG CGCGGGATGC CGGATATTCC ACGGTGGCCG TGATGAGCGG CATTGGGGTA 
AGACCCTATT ATCATAGACA GGGATATCAG CGTATAGGTC CATATATGAT TAAGAATCTA 
TGA

Protein sequence

MEEHTIYREL ISLIFSDPNP DIQHIKLSVC RKYSLDAMPK NSAILAAAKP EEYEALRRVL 
MVKPTRTLSG VAPVAVMTSP CACPHGKCLP CPGGPDHIFK SPQSYTGEEP AALRARQNEY 
DPYRQVTARL GQFKLLGHHV DKAELIVMGG TMTARDAAYQ EWFVSECLRA MNEFSGQKST 
AGSVEELMLE NEKADVRCIA TTFETRPDWC REEHINKMLE LGVTKVELGF QHTDDELLLL 
NKRGHTVADS VLANTLLRDA GIKVGFHVMP NLYGSTIPRD REMFDTLFTD PRFCPDFLKI 
YPTLVTPGAE LEELWQKGEY KTYDEDDLVD LLAYAKSRLP PYVRLQRIQR DIPAKLIVSG 
SIHGHIRQMA AERLKEQGGS CQCIRCREIG RRPSSAVDEE KTLVYPCCGG TEHFLSTTAG 
ESLIGFVRLR FPGTVFRPEL DGAALVRELH VYGEIVPLGV HGSGEKRQHR SYGQQLLSRA 
EETARDAGYS TVAVMSGIGV RPYYHRQGYQ RIGPYMIKNL