Gene Mpal_0221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_0221
Symbol
ID	7270606
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	254320
End bp	255633
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	59%
IMG OID	643568873
Product	S-layer-like domain-containing protein
Protein accession	YP_002465330
Protein GI	219850898
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1361] S-layer domain
TIGRFAM ID	[TIGR01167] LPXTG-motif cell wall anchor domain

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGCGA ATAGATATTC ATCAGGTACA GTCTGGGTTC TCTCCCTGCT GCTGCTCATC 
GCCTGCGTGC TGGTCTCTCC AGCCATGGCC GGTACCAAGT ATCTCTCCGG CGGCCCGTCG 
CTCTCAGCGG CGGTCACCGG CACCAACGAA CTGATCTCCG GCCAGACCGT GCCATTGCAG 
GTGACGGTCC AGAACAGTGG TCTGATCGAC TCCAAGTTCT CCCAGACCGG ACTGGTCGAC 
CGGACCGATC TACCGAACAC CGCCAAGACG GTGACGGTCG GGCTTGGTTC CGGTAGCGCA 
CCGGTCACGA TCCAGTCGGA TCCGCAGATG ATCGGGGATA TCCTCGGAGG TGCTTCCGGG 
CAGTCCAAGT TCAATGTTAA GGTCGAAGCC GATGCTCCAT CAGGCACCTA CACCCTGCCG 
GTCTCAGTGA ATTACACCTA TCTCGAGTCT GCAGAACAGG TCGGGACCGA TTCGCTGAAC 
TATAACTATG TGACCAAGAG CCTGATCATC CCCCTGACCG TCACGATCAG GTCCGAAGTG 
ATCGTCGACG TCCAGAAGAT CTCGGCAGAG CAGTTGAACG TCGGCACTGA GGGATATCTG 
AACCTGACCC TGCAGAACAC CGGGAACGAG AATGGTAAGA ATGCCATCGT GAAGATCGTC 
AGAAACGGTG CCAGCCCGAT CACCCCGACC GACTCCTCGG TCTACATCGG TGACTTTGCA 
AAGGGCGCCG TCGTGAACTG CAGGTACCGG GTCGCGGTCT CCACCGAGGC AGCCGCCCAG 
ACCTACCCGG TCGACGTCAT CGTCGCCTAT GAGGACCATG ACGGGATTAA CAGGACCTCC 
CGGCTCCAGA CGATCGGCGT CCCGATCGGC GGCAAGATAG ACTTCAAGGT CAGCTCTGAG 
GCACCATCGA TCAACCCCGG CCAGAAGAAG GTGCTCGATG TCCAGTACAC CAACGTCGGT 
GCGACCACCG TCTACAGCGC CCAAGCCCGA CTCTCAGCGG TGGACCCGTT CACCTCCAAC 
GATGACACGG CCTACCTTGG GGATATAAAG CCCGGCGACT CGGTGATGGC ACACTTCGAG 
GTATCGACCA CATCAGACGC GACCATCAAG CAGTACGGCC TCGACTCTGA GATACGGTAC 
CGCGATGCAC TCGACAACTC CCAGATCTCG GATACCATGA AGGTCCCGGT GAACGTCGTG 
GCCAAGACAG GGACCAGTGC AATCCTCGGC AACCCGATTA TCCTTGCCGT GATCGCGGCC 
ATCATAATCG GTGTCGGCTA CTTCCTCTAC ACCAGGAAGA AGGGGTCAGC GTGA

Protein sequence

MSANRYSSGT VWVLSLLLLI ACVLVSPAMA GTKYLSGGPS LSAAVTGTNE LISGQTVPLQ 
VTVQNSGLID SKFSQTGLVD RTDLPNTAKT VTVGLGSGSA PVTIQSDPQM IGDILGGASG 
QSKFNVKVEA DAPSGTYTLP VSVNYTYLES AEQVGTDSLN YNYVTKSLII PLTVTIRSEV 
IVDVQKISAE QLNVGTEGYL NLTLQNTGNE NGKNAIVKIV RNGASPITPT DSSVYIGDFA 
KGAVVNCRYR VAVSTEAAAQ TYPVDVIVAY EDHDGINRTS RLQTIGVPIG GKIDFKVSSE 
APSINPGQKK VLDVQYTNVG ATTVYSAQAR LSAVDPFTSN DDTAYLGDIK PGDSVMAHFE 
VSTTSDATIK QYGLDSEIRY RDALDNSQIS DTMKVPVNVV AKTGTSAILG NPIILAVIAA 
IIIGVGYFLY TRKKGSA