Gene Mpal_1643 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1643
Symbol
ID	7272185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	1691039
End bp	1692400
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	54%
IMG OID	643570256
Product	hypothetical protein
Protein accession	YP_002466678
Protein GI	219852246
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.906143
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGTCAT ATCTGCCGTC TAACAGAATT CAGTGGGGGA TCTGTCTCGC CGTCCTCACC 
CTCCTCCTCT CATCCGCACT GATCGGCTCG GTAAGCGCCA CCCCGCCTCC TCCAGATTAT 
AAGGCCTGGT GGGCCACGAC AAACACCGAA TACCTCAATG CATCGGATGC CGGCCTCTTT 
GTCGAGACCG ACGGATACAT CTCCCGGCAG GGACGTGAGA AGAGACCACC ATTCCTGTCG 
AACGTCTCGG ATAATTATTA TTACACCAAC TTCACCTCTC CGAAGACCGG CGAACAGTAT 
CTCACCGCCG TCTGGTACTT CAGTGACTGG GACGGATTCA TAAAAGAGAA GGACGAGCTG 
CACCGATACC TTCAACAACA CGGTACAGTC ACTCCGGTCG CACTCAATCT CTCTCCAGAA 
CTCGCCAGTT CCAATAGTTC TGACCTGGTG AACCTCTCCG GATCTGAGCA ATGGCAGGCG 
ATCGATGCGA CCCAGTACGA GAGTGACGAG ACGTCGGGGT ACCTCCTCAC CTTCGTCATG 
GATTCGCACC CGGGGGTGAA CTACTACATC GCGTACTACG GGGTCGTGGG TCCAACTGAT 
CTGAGAGAGG AAGCTCATCA TCTCCACCTC CTTGCGATGA CGAACCTTCC TGTAATGGTA 
CTGGGTCACT TATACGTCTT CAATCTGACG ACGCCGAAGA CCAATTCACA TGATTCGTCC 
AGCCACACAT CCAGTCTCGC GTCCAACCCC ATATTCAACC CCAAAACCTG GATCCCATTT 
CTCGTGGTAT TCATTCCGAT TCTCCTTCCG ATCATCGGCT TCACCTTCAT CCCGATCATC 
GTCCTCGCGT ATATCTCCGC CAGGATATCT CTATGGATGG AGGCCCGCTT GACTCCACGG 
ACCCGTGCCA TCCTCCCACT GAGCGTCGCC GGTTGTCTGA TCGGGGTGAT TGCCCTCAGG 
TCTCTTTTCA TCGAAGAGAT CTCGCTTGGT TGGACCGATC TCATCGCCGC TGCAATCCTC 
GTCCCAATGG GGGTGCTGAC CGTCAGACCA TTCTTTAAAG AGCGCCTGAA GTACGTGAAG 
CCGAAGTCTG CCGTGTTCCT CTGCGTGGTC GGGACATTCT ACACCATTAT CATTGGTTCC 
CTGTTATACC TTCTTCTGGG TGTAAGTTTT ACCTCGAACC CAGGTTCTCT CGATCAACCG 
CTCTCGTACA TCGTGGGTCG CTCTGTCGTC CTGCGATCAG TCATCCTTTA TATCATGAGC 
GTGGTCATCG CCATCGTTCT TTATGCAGTG ATCCTGTTCT GGGACCTGAT CCGGAGACGC 
CGACAGAGCA AGAAGCATAA AGTGGAGGAT GAAGATCAGT GA

Protein sequence

MSSYLPSNRI QWGICLAVLT LLLSSALIGS VSATPPPPDY KAWWATTNTE YLNASDAGLF 
VETDGYISRQ GREKRPPFLS NVSDNYYYTN FTSPKTGEQY LTAVWYFSDW DGFIKEKDEL 
HRYLQQHGTV TPVALNLSPE LASSNSSDLV NLSGSEQWQA IDATQYESDE TSGYLLTFVM 
DSHPGVNYYI AYYGVVGPTD LREEAHHLHL LAMTNLPVMV LGHLYVFNLT TPKTNSHDSS 
SHTSSLASNP IFNPKTWIPF LVVFIPILLP IIGFTFIPII VLAYISARIS LWMEARLTPR 
TRAILPLSVA GCLIGVIALR SLFIEEISLG WTDLIAAAIL VPMGVLTVRP FFKERLKYVK 
PKSAVFLCVV GTFYTIIIGS LLYLLLGVSF TSNPGSLDQP LSYIVGRSVV LRSVILYIMS 
VVIAIVLYAV ILFWDLIRRR RQSKKHKVED EDQ