Gene Mpal_1007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1007
Symbol
ID	7271741
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	1034566
End bp	1036659
Gene Length	2094 bp
Protein Length	697 aa
Translation table	11
GC content	56%
IMG OID	643569644
Product	periplasmic copper-binding
Protein accession	YP_002466078
Protein GI	219851646
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.525995
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.505832
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCAT ATCCTTCGCT CAGGTCTCTC CTCATCCTTC TCATCTGCTG CAGCCTTCTC 
ATTTTCCCGG CAGCAGCCGA AACGGTGAAC GAATCATTGA AAATGCCGGC ATTCTTCTCG 
GATATTCAGA ACAGGGGGGT AGATCTCCAC GCCACCGACG AGACACCAGT CTACACGGTG 
ATGCACCCCT CATCCGAGCA GCTCAAGGAA TGGGATGCTC AGTACAATGC ATTACCCCTG 
GTGTCGGTGC CGGCTACCGG TTCTTCCAGC CAGCTCCAGA ATAATACCAC ATCTGTGGGC 
GGATACAAGG ATCTCCTCCC TTACCTGGAT TACATCCCGG CTGAACGAAA TCAAGGATCG 
ATCGGGAATT GCTGGGTCTG GGCGGGAACC GGGGTGATGG AGATCGCCCA TGCCGTCCAG 
AACGGGGTGA AGGACCGATT CTCGATCTCG TACCTGGACG CCAACTATAA TGGTGGTTCT 
GGGAATAAAT GGGCAGGGAC TGGAGGAGAT TTCTTTAATC TCGCTAATTT TTATACCACA 
ACCGGGATAG CAGTTCCCTG GTCCAACCTG AACGCTGAGT ACCAGGACGG GACCACATGG 
TCAGGGACAG AACAGCGGTC CTACGAGCCT GCCTTTGCAA TCTCCACAGA ACCCCACTAC 
CAGATCTATC AGATCAAAGC GCAACGGATC GAGACACGAC ATATTGGCAA CGAGCAGGCG 
ATCAGCAACA TTAAGGCTGT GCTCGACCAG AACCGTGCCA TTGGTTTTGG GTTCAATCTC 
CCCAATTCTA CGGCCTGGGG ATCCTTCATA GAGTTCTTCA TGAACAGTTC GGAGGAGACC 
GCATGGAACA TGACCCCCTG GCAGAACACA CTCTATAATG AAAACGAGGG CGGGGGGCAT 
GAAGTACTCT GCGTCGGATA CAATGACACC GACCCGACGA ACAGGTACTG GATCATGGTC 
AACTCCTGGG GAGTCTCGGA TGGGCATCCA CGCGGCGTCT TCCGAGTTTC GATGGACATG 
GACTACTCTG CGACAATGCA GTTCAGAGAC AATGATGATT GGGCTGCCCT GGTGTGGCAG 
ACGCTGGACG TCAACTTTGC AGCCACCCCA TCACCGGCGC CGAAGGAGAT CAGTTCCCTC 
CCGTACACCT GCTCGGTTCC CGGTGAATAT TACCTTGCAA AGGATCTGAT CAGCAGCGAC 
GCCGATACGG GGATCCTGGT CACGGCACAG AATGTGACGA TCGACGGGAA GGGACACCTC 
CTTCGGGGCT CCGGCCGGCA GGGATCGGTC GGGATCCTCG CGTACAACAA CGGAGACCCT 
GTCGATGGAC TGAATATCAC CAACCTGGCC ATCTCAAACT GGGAGGACGG GTGTTACCTG 
TATCATGCCA CCAACGGATC GGTGAATGAT ACCACCATCT CCGACTGCTC GTATGCCGGA 
ATCTTCCTGG ATGGAGAAAC TACCAACCTC GCAATCGCTG ACAACACACT CACCTCCAAC 
TATCGCGGCC TCCTCTCCCG TTCCACAGCC GATATCAGGG TCGAGCACAA CAGGATAACC 
GAAAGTCTGA ATACCGGGCT GTACCTCCTC TCAATGAACC AGAGTTTAAT CGCAGACAAC 
CAGATTGTTA ACGGACAGAA CGTAATCATC TCTGGGTGGG TCAATACGAC AAGTTGGAAC 
ACCAGTAAGA CCACCGGACA GAACCTGGCA GGCGGCCCGT ACCTGGGCGG CAACTACTGG 
GGGAACCCCA CACAGACCGG GTTCTCCGAC CTTGCAGTCG ATCAGAACCG GGACGGATTC 
GCTGACAGCC CAAACCAGAT CGCAGCCGGC ACCATGGACC AGTTCCCCCT CGTCGCCTAT 
GCGAACCCTG GTCCACAGCC GATCCCGCCG AACCAGCTTG ACCCGACCGA TCCCGATCAC 
GACAGGCTCT ACGAGGATCT GAACGGGAAC GGCAAGCTCG ACTTCGGCGA TGTGACCACC 
TTCTTCAACC AGATGGACTG GATCGCCGAC CATGAACCGG TGCAGCTCTT CGACTTCAAC 
GGCAACCAGC AGATCGACTT CGGCGACGTC GCCGCGCTCT TCTCACGGCT GTGA

Protein sequence

MSSYPSLRSL LILLICCSLL IFPAAAETVN ESLKMPAFFS DIQNRGVDLH ATDETPVYTV 
MHPSSEQLKE WDAQYNALPL VSVPATGSSS QLQNNTTSVG GYKDLLPYLD YIPAERNQGS 
IGNCWVWAGT GVMEIAHAVQ NGVKDRFSIS YLDANYNGGS GNKWAGTGGD FFNLANFYTT 
TGIAVPWSNL NAEYQDGTTW SGTEQRSYEP AFAISTEPHY QIYQIKAQRI ETRHIGNEQA 
ISNIKAVLDQ NRAIGFGFNL PNSTAWGSFI EFFMNSSEET AWNMTPWQNT LYNENEGGGH 
EVLCVGYNDT DPTNRYWIMV NSWGVSDGHP RGVFRVSMDM DYSATMQFRD NDDWAALVWQ 
TLDVNFAATP SPAPKEISSL PYTCSVPGEY YLAKDLISSD ADTGILVTAQ NVTIDGKGHL 
LRGSGRQGSV GILAYNNGDP VDGLNITNLA ISNWEDGCYL YHATNGSVND TTISDCSYAG 
IFLDGETTNL AIADNTLTSN YRGLLSRSTA DIRVEHNRIT ESLNTGLYLL SMNQSLIADN 
QIVNGQNVII SGWVNTTSWN TSKTTGQNLA GGPYLGGNYW GNPTQTGFSD LAVDQNRDGF 
ADSPNQIAAG TMDQFPLVAY ANPGPQPIPP NQLDPTDPDH DRLYEDLNGN GKLDFGDVTT 
FFNQMDWIAD HEPVQLFDFN GNQQIDFGDV AALFSRL