Gene Mpal_1201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1201
Symbol
ID	7271479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	1234488
End bp	1235786
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	58%
IMG OID	643569838
Product	S-layer-like domain-containing protein
Protein accession	YP_002466262
Protein GI	219851830
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1361] S-layer domain
TIGRFAM ID	[TIGR01167] LPXTG-motif cell wall anchor domain

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAGTTTC GTAAGTTTTT CATTATTCCA CTCCTAATCG TACTCATCGC CTGCGTGCTG 
GTCTCTCCAG CCATGGCCGG TACCAAGTAT CTCTCCGGCG GCCCGTCGCT CTCAGCGGCG 
GTCACCGGCA CCAACGAACT GATCTCCGGC CAGACCGTGC CATTGCAGGT GACGGTCCAG 
AACAGTGGTC TGATCGACTC CAAGTTCTCC CAGACCGGAC TGGTCGACCG GACCGATCTA 
CCGAACACCG CCAAGACGGT GACAGTCGGG CTTGGTTCCG GTAGCGCACC GGTCACGATC 
CAGTCGGATC CGCAGATGAT CGGGGATATC CTCGGAGGTG CTTCCGGGCA GTCCAAGTTC 
AATGTTAAGG TCGAAGCCGA TGCTCCATCA GGCACCTACA CCCTGCCGGT CTCAGTGAAT 
TACACCTATC TCGAGTCTGC AGAACAGGTC GGGACCGATT CGCTGAACTA TAACTATGTG 
ACCAAGAGCC TGATCATCCC CCTGACCGTC ACGATCAGGT CCGAAGTGAT CGTCGACGTC 
CAGAAGATCT CGGCAGAGCA GTTGAACGTC GGCACTGAGG GATATCTGAA CCTGACCCTG 
CAGAACACCG GGAACGAGAA TGGTAAGAAT GCCATCGTGA AGATCGTCAG AAACGGTGCC 
AGCCCGATCA CCCCGACCGA CTCCTCGGTC TACATCGGTG ACTTTGCAAA GGGCGCCGTC 
GTGAACTGCA GGTACCGGGT CGCGGTCTCC ACCGAGGCAG CCGCCCAGAC CTACCCGGTC 
GACGTCATCG TCGCCTATGA GGACCATGAC GGGATTAACA GGACCTCCCG GCTCCAGACG 
ATCGGCGTCC CGATCGGCGG CAAGATAGAC TTCAAGGTCA GCTCTGAGGC ACCATCGATC 
AACCCCGGCC AGAAGAAGGT GCTCGATGTC CAGTACACCA ACGTCGGTGC GACCACCGTC 
TACAGCGCCC AGGCCCGACT CTCAGCGGTG GACCCGTTCA CCTCCAACGA TGACACGGCC 
TACCTTGGGG ATATAAAGCC CGGCGACTCG GTGATGGCAC ACTTCGAGGT ATCGACCACA 
TCAGACGCGA CCATCAAGCA GTACGGCCTC GACTCTGAGA TACGGTACCG CGATGCACTC 
GACAACTCCC AGATCTCGGA TACCATGAAG GTCCCGGTGA ACGTCGTGGC CAAGACAGGG 
ACCAGTGCAA TCCTCGGCAA CCCGATTATC CTTGCCGTGA TCGCGGCCAT CATAATCGGT 
GTCGGCTACT TCCTCTACAC CAGGAAGAAA CAGAACTAA

Protein sequence

MKFRKFFIIP LLIVLIACVL VSPAMAGTKY LSGGPSLSAA VTGTNELISG QTVPLQVTVQ 
NSGLIDSKFS QTGLVDRTDL PNTAKTVTVG LGSGSAPVTI QSDPQMIGDI LGGASGQSKF 
NVKVEADAPS GTYTLPVSVN YTYLESAEQV GTDSLNYNYV TKSLIIPLTV TIRSEVIVDV 
QKISAEQLNV GTEGYLNLTL QNTGNENGKN AIVKIVRNGA SPITPTDSSV YIGDFAKGAV 
VNCRYRVAVS TEAAAQTYPV DVIVAYEDHD GINRTSRLQT IGVPIGGKID FKVSSEAPSI 
NPGQKKVLDV QYTNVGATTV YSAQARLSAV DPFTSNDDTA YLGDIKPGDS VMAHFEVSTT 
SDATIKQYGL DSEIRYRDAL DNSQISDTMK VPVNVVAKTG TSAILGNPII LAVIAAIIIG 
VGYFLYTRKK QN