Gene Mpal_2089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_2089
Symbol
ID	7271566
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	2215916
End bp	2217325
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	63%
IMG OID	643570700
Product	hypothetical protein
Protein accession	YP_002467110
Protein GI	219852678
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0175] 3'-phosphoadenosine 5'-phosphosulfate sulfotransferase (PAPS reductase)/FAD synthetase and related enzymes
TIGRFAM ID	[TIGR00451] uncharacterized domain 2

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTTCAC TCTATCTTGG AAAGATCCAG CTCCACTGGT GTGATTCCTG CCATGTTCCG 
GTGCTCGGAG GACGGTGCAG GTGTGGCGCT GAGACGCGTT CCGTTCCGTT GACCCCCCCC 
GGGGACATGC GCCCGGCGTT CGAATACGAT ATCGACCTGA TCAACCGGAT CTATACCGCT 
CACTTCGGGA CACCCCTGAT CCCGGATGGG CACCTCGCCC TGCTGAACAA GGTCCCTGAC 
AAGGACCGGA TGGAGGAGAT CGTGGTCGGG GGGGCCGTGG TCGGCCAGAT TCGGTACCTG 
CCGGAGAAGG AGGAATGGGA ACCGATTCCC CGGCCGGCTG CCGCGGCGCT GCTTACGCCG 
ACCGAACGGT TCGTGGTGAT CGATGACGGG GCGATCCCTT CGATCCGGGA TGAAGGAGCC 
AGTGTACTGG CGCCGGGGCT CGCCTGGATC GCCGATTCGG TCGAGGCCGG CGATGAGGTC 
TTCATCATGA CCAGGGACCA CCAGTGTGTC GGTGTCGGGC GTGCCCGGGT CGGTGCAGCC 
GAGGCACGGA CCATGGAACG GGGAGCCATC GTGAGGACCA GAAGGAACAC CTCCGCTCCC 
TGTATCCCCG GGGAGGCCAC CTGGGCGGAC GCGGTCAGGG CCAATCAGGC GATCATCGAC 
AACTACGAGG CGATGGCGAT GGCCTTCGTC CGCGATGTCG CCGCGGCAAA CCCCATCCCG 
GCGACGGTCT CGTTCTCTGG CGGAAAGGAC AGCCTGGTGA CGCTACTGAT CGTCCAGAAG 
GCGCTTGGAA AGGTGCCGAT CCTCTTCTCC GATACCGGGC TGGAGTTCCC TGAGACCTAT 
CAGAATCTCA AGGATGTGCA GGAGAAGTAT GACCTCGAGG TCGTCTCCTG TTCAGGTGAG 
GCCGCGTTCT GGGAGACGCT CACCGAGCAG GGGCCGCCGG CCGTCGATGC ACGCTGGTGC 
TGCAAGGTCT GCAAGCTGAC CCCGATCGGC GGGGCGATCC GGGAGCGCTG GGGGGAGTGC 
CTCTCCTTCA TCGGACAGCG GAAGTATGAG TCGTTCAAGC GGATGAAGAG CGGGCGGGTC 
TGGAGGAACC CGAATCTGCC GATCCAGCTC TCGGCGGCTC CGATCCAGCA CTGGACCGCC 
CTGCATGTCT GGCTGTACCT CTTCGCCGAG GAAGCACCCT ACAATGCACT GTATCGGGCC 
GGGTTCGACC GGGTCGGCTG TTATATGTGT CCGTCCAGCG ATCTCTCGGT GCTGCTCAGG 
ATCGAGCAGG AGTATCCGGA CCTCTGGGAG CAGTGGAACC ATCGGATCGC AGCCTGGCAG 
CAGGATAAGG GGTTGCCAGA GGACTGGTTC CGGTCGGGAT CGTGGCGGAA GAGGGCAGGT 
GATTCTGGTG AAGAAGATAG TAGTTGTTGA

Protein sequence

MPSLYLGKIQ LHWCDSCHVP VLGGRCRCGA ETRSVPLTPP GDMRPAFEYD IDLINRIYTA 
HFGTPLIPDG HLALLNKVPD KDRMEEIVVG GAVVGQIRYL PEKEEWEPIP RPAAAALLTP 
TERFVVIDDG AIPSIRDEGA SVLAPGLAWI ADSVEAGDEV FIMTRDHQCV GVGRARVGAA 
EARTMERGAI VRTRRNTSAP CIPGEATWAD AVRANQAIID NYEAMAMAFV RDVAAANPIP 
ATVSFSGGKD SLVTLLIVQK ALGKVPILFS DTGLEFPETY QNLKDVQEKY DLEVVSCSGE 
AAFWETLTEQ GPPAVDARWC CKVCKLTPIG GAIRERWGEC LSFIGQRKYE SFKRMKSGRV 
WRNPNLPIQL SAAPIQHWTA LHVWLYLFAE EAPYNALYRA GFDRVGCYMC PSSDLSVLLR 
IEQEYPDLWE QWNHRIAAWQ QDKGLPEDWF RSGSWRKRAG DSGEEDSSC