Gene Mpal_0103 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_0103
Symbol
ID	7272273
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	121905
End bp	123959
Gene Length	2055 bp
Protein Length	684 aa
Translation table	11
GC content	56%
IMG OID	643568760
Product	hypothetical protein
Protein accession	YP_002465219
Protein GI	219850787
COG category
COG ID
TIGRFAM ID	[TIGR02537] archaeal flagellin N-terminal-like domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGGCA GTAACCGGGG CATCCCGGGG CCGGCCGGAC GCCATATCGA GCACGACGCA 
GGGGTCTCCG AGATCATCGG AGCCGTGCTG CTGATCGCCC TCGTCGTCGC CGGCGGAACC 
CTGGTCGGGG TGGCACTCTT CTCGCAGCCG CTCCCGACCC AGGTGCCGAA GGTGAATATC 
GTCATCGGGG CAGACCAGAA CGGGACGGTG ACCCTGGTCC ACAATGGCGG GGAAGCACTG 
AACCCCGGCC AGTACCTGGT TTACCTGGAC CAGACACCCT GGCCTCTGAA TAAGAGCTTC 
GTCAACAACA ATACTAGTAC CCCGGCGGAC ACCACGGTCT GGTCGGTGGG GAACTCGCTG 
ACCCTCAGGG GGAGCGATGC GAACCTGACC GACAATGTCA CGGTCGTGTA CTCGGGCAGT 
TCAGGGAACG TCACGATCAC CTCGGTGAAC GCTGTCGGGA CAGGGGAAGG AGGCTACGGG 
TTCTTCTCGT CACTCTTCGA GTACATCCTG GGGAAGCACC CGGAGCAGTA CCCGGAGGGG 
ATCGTGCCGC TCCCAACCCA GCAGGTGACC CATTACCCGC CGGTCGGACC ATACAACTGG 
TCGAACATTC AGCCGCGTAT CGATTACACC GACTGGGCCG GTCAGTCAGA ATGGATGAAC 
ACCACTGCCT ATATCTATAC CTCAGGCAAC TCCGACAGTA GTTATGATAC CCCACCTGAC 
GTTATCACAA GCACAGTCCC AGGTGGTATG AGTGCCCCAA ATCTGTTTAG ATTCACTGAT 
GTGAACACGA TCAATGATGA GTTGCACAAT TATGGCAGGG TGGTGATGCT CGACGGTGTC 
TATGTCTGCA ACGGGCCAAT CCGTTTCGAC AACAGTTACA AGATACTCAT GGCTCAGAAT 
CCAGGTACGG TCTATCTCCC CATGAATGGA CCTTCTTACA ACGATGGTTA CATCAAGGTG 
AGTGCCCCGA ATGTGATCAT CAGCGGGCTC AACCTTGAGG GAACTGGAGG TGTTGAGATC 
GTTTCGAGTT ATGTCAGTGT TCAGGGTGTG AATGTAACCA GTCGAAACCA TGGTGAACTC 
TCCGCGAATC ACGACCCGAA CGAGCCGCCA GCGAACAAAG CTCCAATCAA CGGGATGTTC 
TTTGTATGGG CTGACGGCCA GCCTCTTTCA AACATTGAAT TTTTCAACTG TACAGCCCGC 
GAATGCAACA CCCACGGCTG GAACATGAAT CAGAACTGGA ACAATGTGCC ATATTCCATC 
AGCAATACGC TCTTTGTAAA TTGCGTGGCC TCATACTGTG GATATGGATC AGCCGGGGAC 
ACGGTCAACT ATATCAATGG TTCAACCAGT ACCGTTTCAG CAGAACATCA ATCCCGGTCC 
GAGTGGATCA CCGGGTTCGA CCTGCACGAA TGGCAGGACC TGATCGAATG TCACGTATAC 
AACTGTTATG CAGACAACAA CTGGGAGTCG GGATTCCACT TCGAGCCCGG TGCCCGGTAT 
GGTGATAACG GAGAGGATAT CGGGCCACGG ACCAGGTCAG AGAATGTCAC ACTGGACAAC 
TGCACCAGTA TCGACAACGG CCGGTCGACC TATAGCGGCG CTTTCTTCCA ATCCGGTTAC 
TACCTCTCGC GGAACACCAC GCTGACCAAC TGCACCTCGG TTGACAACGC CAACGCCGGG 
TTCTATGTCC AGGGCGGTAT CAACTCCCAG TTCGTCAACT GCACGGACAC CGGAAGCAAG 
AACACCGGCT TCCTCGTGAT CAAGGGGTCA AGCGACATCA CCATCGACAA CTGCATCTCG 
AAGGACAATC CAAGGTTCGC CCTCTGGACC GCGTTCACCG AGAACCTGCA GGTGAAGAAC 
TTCCAACAGC TCAATGTCAC TGGAGGGACG GGTTTTGGAA CCCAGACCCA GTCGATCCTC 
GGGTGGTACA AGGATGATTC GCGGTACCAA CTGCCAGTGA CCGACTCATA TATCCAGATC 
ACCGCGGATA AGAATTCCCC GCAGATCATC AACCAGGCCG GCAGTGGAAA TACCTACGAT 
CTCAGGCCCT CCTGA

Protein sequence

MSGSNRGIPG PAGRHIEHDA GVSEIIGAVL LIALVVAGGT LVGVALFSQP LPTQVPKVNI 
VIGADQNGTV TLVHNGGEAL NPGQYLVYLD QTPWPLNKSF VNNNTSTPAD TTVWSVGNSL 
TLRGSDANLT DNVTVVYSGS SGNVTITSVN AVGTGEGGYG FFSSLFEYIL GKHPEQYPEG 
IVPLPTQQVT HYPPVGPYNW SNIQPRIDYT DWAGQSEWMN TTAYIYTSGN SDSSYDTPPD 
VITSTVPGGM SAPNLFRFTD VNTINDELHN YGRVVMLDGV YVCNGPIRFD NSYKILMAQN 
PGTVYLPMNG PSYNDGYIKV SAPNVIISGL NLEGTGGVEI VSSYVSVQGV NVTSRNHGEL 
SANHDPNEPP ANKAPINGMF FVWADGQPLS NIEFFNCTAR ECNTHGWNMN QNWNNVPYSI 
SNTLFVNCVA SYCGYGSAGD TVNYINGSTS TVSAEHQSRS EWITGFDLHE WQDLIECHVY 
NCYADNNWES GFHFEPGARY GDNGEDIGPR TRSENVTLDN CTSIDNGRST YSGAFFQSGY 
YLSRNTTLTN CTSVDNANAG FYVQGGINSQ FVNCTDTGSK NTGFLVIKGS SDITIDNCIS 
KDNPRFALWT AFTENLQVKN FQQLNVTGGT GFGTQTQSIL GWYKDDSRYQ LPVTDSYIQI 
TADKNSPQII NQAGSGNTYD LRPS