Gene Mpal_1798 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1798
Symbol
ID	7270344
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	1889861
End bp	1891909
Gene Length	2049 bp
Protein Length	682 aa
Translation table	11
GC content	60%
IMG OID	643570413
Product	hypothetical protein
Protein accession	YP_002466827
Protein GI	219852395
COG category	[R] General function prediction only
COG ID	[COG3889] Predicted solute binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAAAAC ATTTACGTAA CCTGAACTAC CGTGCATCGC TGTCAGTGCT GATCAGTTTC 
GCCCTGATAC TGCTCGCACT CACCATTACT GTTCCAGTCG GAGCAGAGAG CGTACTCCCC 
GATCACTATC ATATCAATCT CGCCATGGCG AATGGCGGAG AGCGATATCT CAAGTTCGAT 
GGAGGCGGTC TGAATGCGCT TCATATCTCC AGCGACTCCT CGAATTATGG TGGGAACTCG 
ATCGCGTCTG ACTCCCAGTC GGGTTCCTTC TTTCTGACCG ATACCGGAGG GAGAGGGTTT 
GACGACGACG GGATCCTCAT GCTCGCGGTG AAGGGGGATG TCCCCGACGA TTTCAGCGTC 
CATATCCGGG CGAGCGGCTA CACCTGGACG CCGTCCACGG TGATTAACCA GAAGCCGGAG 
GAGATCACCT ACCAGGATGG GTCCGTCGAC AGCACCTTCA CCAAATCCGA TTTCGCCTAC 
GGTCCTCAGA ACTGGAGGCC AGCCGGGCCG GAGAACTACC CGATCTATGA CGGCCAGGAT 
ATGAGTGACT CCACGCAGCA GTTCCACCTG ATGTTCATCG ATCTGCATGC AGGCATCCTC 
GGCCAGGGAA GTGTGAACAC CAGCGCTCCT CCCCTTACGG ACAACGGAGC GATCAGGGTC 
GAATACTCGT TTTCGAATCT GAACTCGTTC GCTGCGTTCA ACACCTATGC CTGGTGCCTG 
AACTCCAACC AGGGAGAGGG GATCTCCTGG ACCAACCGGC TCTCTGAAGC GGGGAGCAGC 
GGTGTCACAG TGAAAGGGAT CGAGCCCACC CTGACAACGG TACCGACCAC AACAGAACCG 
ACCACCACGA CTACGACCCC GAATACGACG GTATCAGTCT CACCGACAGA GACCCCAACC 
TCTGTCGAGA CGACGGTGAA TGCCACGCCG ACCGTCATCG TCAATACGAC CGAGCCGACA 
TCGACGACGA TGGTCCCGGT CACCACCCTG ACGACCGAGC CGACCACGTC GGCGACCCTC 
ACCACCGTTC CGACCTCCAC GACGACCATC AAGACCACGC CGACGACATC TGCGACGGTG 
ACGGTGGCCG GGACTGCAAC GGTGACGTCC ACGCAGACAG CCGGCACCGT CATCACGACC 
AGTGCTCCGG TGACCACCGG CACGACCGCC GCGGTCACCG TCTCCCAGAC CACCGCCCAA 
CCATCGCTGA CCGTCGCTCC CTCGGTCACC ACAACTCAGA GTCCCGAACC GTCGGTTTCA 
GTTCCTGTCC TGAGCACGCT CTTCCCCTCA CATGTCCAGA CCGCCGTTCC GACCCAGGCT 
GCGACCAGTG GTTCTCAGGT CGCGTCTTCC ACATCAGGTG CATGGATGGT CGGAGCAACT 
GTTCCGCCTG TGCAGGCAAC CGTGACCTCG CAGAGTACAC AGACGGTCGC ATCCAGCGCC 
ACCACCGTGC AGGCGACTGT TTCCTCAGGG AGTACCCAGA CGATCGCTAC CCAGTCTTCT 
TCACCGTCGA CGGGTAGTAC CAGCAGTAAT TCCGCCGGAG GGCCAGTCTC GACCGGCGAC 
TCCTCCTCCG GTTCTTCGAG CGACGATTAC ACTGGAGTCG GTGGGACGGT CGGGACGACG 
GCGACGCCGG CTCCCACGAC CGCCACGCCG ACCCAGACAC AGTCAGCCGA TACCACGCCC 
ACCCCGACGC TGGTGAATAC CAGCACCCCG GTGATGACGA CACCGACGCT CCCTCTGATC 
GATACCGGAA ACCAGAACGA GTACTCGCCG GTCTCTATCT CCGGTTCGTC GGGTGCCGCC 
TCTTCCCGCG ATCAGAGTTC GTCACAGAAT TTCCTCTCGA TGATCCAGTC GACCATCGAT 
CGGCTCTCAT CGTCGGACCT GAGTCTGCTT CTGCTGATTG GGGCAGCACT CCTGTTCGCT 
CTGCTCGTCT TTGCAGGGTT GATCATCATG ATCCTGCTTC TCCTCCTGCT CGTGATCGGG 
CTTCTGTACC TCAGGCAGAG GAGGAATCTG AAGGACGGTC TGCTGGATGA TCTGCAGGAG 
AAAGACTGA

Protein sequence

MTKHLRNLNY RASLSVLISF ALILLALTIT VPVGAESVLP DHYHINLAMA NGGERYLKFD 
GGGLNALHIS SDSSNYGGNS IASDSQSGSF FLTDTGGRGF DDDGILMLAV KGDVPDDFSV 
HIRASGYTWT PSTVINQKPE EITYQDGSVD STFTKSDFAY GPQNWRPAGP ENYPIYDGQD 
MSDSTQQFHL MFIDLHAGIL GQGSVNTSAP PLTDNGAIRV EYSFSNLNSF AAFNTYAWCL 
NSNQGEGISW TNRLSEAGSS GVTVKGIEPT LTTVPTTTEP TTTTTTPNTT VSVSPTETPT 
SVETTVNATP TVIVNTTEPT STTMVPVTTL TTEPTTSATL TTVPTSTTTI KTTPTTSATV 
TVAGTATVTS TQTAGTVITT SAPVTTGTTA AVTVSQTTAQ PSLTVAPSVT TTQSPEPSVS 
VPVLSTLFPS HVQTAVPTQA ATSGSQVASS TSGAWMVGAT VPPVQATVTS QSTQTVASSA 
TTVQATVSSG STQTIATQSS SPSTGSTSSN SAGGPVSTGD SSSGSSSDDY TGVGGTVGTT 
ATPAPTTATP TQTQSADTTP TPTLVNTSTP VMTTPTLPLI DTGNQNEYSP VSISGSSGAA 
SSRDQSSSQN FLSMIQSTID RLSSSDLSLL LLIGAALLFA LLVFAGLIIM ILLLLLLVIG 
LLYLRQRRNL KDGLLDDLQE KD