Gene Mpal_1916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1916
Symbol
ID	7272733
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	2031565
End bp	2033016
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	59%
IMG OID	643570530
Product	extracellular solute-binding protein family 3
Protein accession	YP_002466943
Protein GI	219852511
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.114513
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTGCAG GCGCCCTGCT CGTCGTTCTG ATGATCGGAG CCGGGTGCAC GACAGTAAAG 
AACGAAACCG GAGATAAACT GGTCTTCTAC ACCGATCAGT ATCCTCCCTT CAGTAGCCAG 
GAGAACGGCA CGCCAACCGG GATCATGGTC GACATGCTGA ACTCGACGAT GACAGAGATG 
GGCAGGGGGC CGGCCGACAT CAAGGTCACC TGCTGGACCA GTGCCTATCA GACTGTCCTC 
TCCACCCAAA ATACGGTGCT CTTTTCGACC ACACGCACCT CTGATCGTGA GCAGCTCTTC 
AAGTGGGCCG GCCCGGTCCT GACCGATAAG GTGGTGGCCT TCTCCTACCG CGAACGACCG 
GTCGTGGTGA ACAGCACCGC CGATCTGAAA CGCTACCGGA TCGGAGCGGA GGAGAACGAC 
GCAGTCATCG GGAACCTCCT TTCCCTCGGG GTTCCGAAGG AGCAGATCGT GACCGCTCCA 
GACCCCCAGA CCATGATCAG GCAGGTCCAG AACGGCTCGA CCGACCTCTT CGCCTATGGA 
GAGGAAGCCG GTAACTACTG GATCGCACAG TCCGGGACCA GTTCAGGCCT CTTCTCAACA 
GTCGTCACCA TCAGGGAGGA CCCGGTCTAT TACGCGTTCA ACCGGAACAC CTCGGACCAG 
ACCGTCCAGG CCTTCCAGCA GGCCCTCAAC CGGTCTATCC AGTCCGATCT CGACCGGGTT 
CTCGATGCAA ATCTGCCCGA GCGTAGCCTC GCCCGGCTCA ATTATCTGAC TGAAGAGTCC 
CGGCCGTACA ACTTCGTGGC GAACGGGACC GTGCAGGGGA TCTCGGTCGA TCTCCTCAAC 
GCGACGCTCT CCCGGCTCGG TGTCCCGGCG AATGCCACAT CAGTCAGGAT CGTCCCCTGG 
AATGAGGGGT ATACAGATAC ACTGACGAAG AACGATACGG TCCTCTTCGC GACCGCCCGA 
AACCCTGAAC GTGAGAACCT CTTCCTGTGG GCAGGACCGA TCGGGCGGCA CGATTATGTT 
CTCTTTGCGG ACAGGACCAG AAATATCTCG ATCTCGACCG ATGCCGACCT CGCCCGGTAC 
CGGATCGGAG CCGTCACTGG TGACGTCGGA GTCAAGTACC TGGCCGACCA TGGTGTCCCA 
AAAGATCGGC TGGTGCTCGA TGCCAATGCA ACAACAGGGG TTCAGCGACT CGCCTCCGGA 
GAGATCGACC TCTTCGCCGA TTCCATGGAG CCCAACCAGA CGGAACTGAA CAGCACGGTC 
GCGAATTCGG AACGGTTCCA GAATGTATAC ACCATCGGGG GGAGCGAACT CTACTATGCA 
TTCAACCGGA ATGTCTCGCC AGAGCTGGTC AGGGCCTTCC AGCGGGGGCT CGATAGCGTG 
AAGAACGAGA AGGATACGAG CGGGGTCTCG GACTACGAAC GGATCATGGA AAAGTACGCA 
GGGGTCAGGT GA

Protein sequence

MVAGALLVVL MIGAGCTTVK NETGDKLVFY TDQYPPFSSQ ENGTPTGIMV DMLNSTMTEM 
GRGPADIKVT CWTSAYQTVL STQNTVLFST TRTSDREQLF KWAGPVLTDK VVAFSYRERP 
VVVNSTADLK RYRIGAEEND AVIGNLLSLG VPKEQIVTAP DPQTMIRQVQ NGSTDLFAYG 
EEAGNYWIAQ SGTSSGLFST VVTIREDPVY YAFNRNTSDQ TVQAFQQALN RSIQSDLDRV 
LDANLPERSL ARLNYLTEES RPYNFVANGT VQGISVDLLN ATLSRLGVPA NATSVRIVPW 
NEGYTDTLTK NDTVLFATAR NPERENLFLW AGPIGRHDYV LFADRTRNIS ISTDADLARY 
RIGAVTGDVG VKYLADHGVP KDRLVLDANA TTGVQRLASG EIDLFADSME PNQTELNSTV 
ANSERFQNVY TIGGSELYYA FNRNVSPELV RAFQRGLDSV KNEKDTSGVS DYERIMEKYA 
GVR