Gene Mpal_2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_2041
Symbol
ID	7272022
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	2161846
End bp	2162898
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	56%
IMG OID	643570653
Product	hypothetical protein
Protein accession	YP_002467063
Protein GI	219852631
COG category	[R] General function prediction only
COG ID	[COG3943] Virulence protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGAGC CGGCCGGAGG TTTGTCCGAG TTTCTTCTCT ACCAGACCGA AGGGGGCGAG 
ACCCGTGTCC AGGTCAGCCT GTTCGAGGGG ACGGTCTGGC TGACGCAGCG GTTGATCGCC 
GAGTTGTATC AGAAATCGAT CAAGACAATC AACGAGCATA TCAAAAACAT CTACGAGGAG 
CGGGAACTCG ACCCCCAAGC AACTATCCGG AAATTCCGGA TAGTTCAACT GGAGGGTGAC 
CGCCAGGTCG AGCGTCTGGT GGACTTCTAC AACCTCGATA TGATCCTTGC CGTGGGCTAC 
CGGGTGCGGT CGCACAGGGG GACCCAATTT CGACAGTGGG CGACGAAGCA ACTGCGGGAA 
TATGTGGTGA AGGGTTTTGT CCTGGACGAT GAGCGCCTGA AGGAGGCCGG CGGGATCGGG 
AGGGACTACT TCGACGAACT TCTGGAGCGG ATCCGTGACA TCAGGGCGTC GGAGAGGCGG 
TTCTACCAGA AGATTACTGA TATCTATGCG ACGAGCGTCG ACTATGATCC GAAAGACCCG 
ATGACACTTG AGTTCTTCAA GACGGTACAG AACAAGATGC ACTGGGCGAT CCACGGGCAT 
ACGGCGGCTG AGACGATATT CCTCCGGGCT GATGCGAGGA AGCCGCACAT GGGGCTGACG 
ACCTGGAAAC AGGGGCCGAA AGGGCGGATC CACAAGACCG ATGTGGGGGT TGCGAAGAAC 
TACCTGACCA GGGAAGAGAT CTCAAACCTG AACCTGATCG TGAACCAGTA TCTCGACTTC 
GCTGAGTTTC AGGCCCGCCA GCGCCGGGAG ATGAGGATGG AGGACTGGAT CAGGAAACTG 
GATGGTTTTA TTCAGTTGAA TGACCGGAAC GTTCTCAAAA ACGCCGGGAG TATTTCGGCA 
GAAAGGGCGA AGCAGAAGGC GCAGAAGGAG TTTGAGGGGT CTGAAGCGCA GCGCCGTATC 
AAGGAGGCGA GCGAGCCGAC AAGCGACTTC GACCTGATGG TCGACGAGGT TACGTATCTC 
TCCAAGAAGC AGGAGGACGA AGATGAAGTC TGA

Protein sequence

MREPAGGLSE FLLYQTEGGE TRVQVSLFEG TVWLTQRLIA ELYQKSIKTI NEHIKNIYEE 
RELDPQATIR KFRIVQLEGD RQVERLVDFY NLDMILAVGY RVRSHRGTQF RQWATKQLRE 
YVVKGFVLDD ERLKEAGGIG RDYFDELLER IRDIRASERR FYQKITDIYA TSVDYDPKDP 
MTLEFFKTVQ NKMHWAIHGH TAAETIFLRA DARKPHMGLT TWKQGPKGRI HKTDVGVAKN 
YLTREEISNL NLIVNQYLDF AEFQARQRRE MRMEDWIRKL DGFIQLNDRN VLKNAGSISA 
ERAKQKAQKE FEGSEAQRRI KEASEPTSDF DLMVDEVTYL SKKQEDEDEV