Gene Mpal_2356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_2356
Symbol
ID	7272077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	2499689
End bp	2500729
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	58%
IMG OID	643570959
Product	glycosyl transferase family 2
Protein accession	YP_002467362
Protein GI	219852930
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.934543
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.35695
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGATG AACCTGCAGT CTCGATCGTA CTGGTAAACT GGAACGGCTG GAAGGACACC 
GTGGAGTGTC TGACCTCCCT CTCTCGCCTG CAGTACCACA GGATCCAGAT CGTGATCGTA 
GACAATGGGT CGACCGATGG CTCAGTGGAG AAGATCGGTG ATTACTGTCA GGGTCGTCTC 
AACGTCACCT CCCCGTTCTT CCCGGACCAG CCGGCAGTAG TAGCAGTCTC ATTCTCTCTA 
CTGACTGCAG AAGAGGCCAG GTCGACCGGA GCCGTAAACG CCGAAACGGG CACGGTCACC 
GTCATCACCA ACCAGAGGAA CCTCGGATTC GCCGAGGCGA ACAATCAGGG GACCCGGTTC 
GCTCTTCGGG CGTTCGAGTC CGATTATGTC CTCTTTCTGA ACAACGACAC CATTGTGGAC 
CCCGGATTCC TCACCGCATT CATTGCGGTC GCCAAAGAGG ATCCGTCGAT CGGGTTCCTC 
GGCCCCAAGA CCTGCTACTA TGACTACCAG GGGCGACGGG ATGTGATCAA CTTCGCTGGT 
GGGGAACTGA GTCTCCTCAC CGGGAACACC GTGCACATCG GCCAGAACCA GCCGGACCAG 
GGGCAGTTCG ACACCCAGAG GACCGTCGAC TATGTCGAGG GGTCCTGCCT TCTGGCCCGT 
TCCTCGATGC TCCGGCAGAT CGGTCTCCTC GACCCCGGCT ACTTCGTCTA CTATGAGGAG 
AACGACCTTG TTATGCGGGG GAGAGAAGCA GGATTCTCGG CCGTCTATGT CCCGACAGCG 
GTGATCTGGC ACAAGGTCTC GGCCTCCTCC AAGAAGACCC CTATCAAGAC CTACTACATG 
GCCAGGAATC GATTTTGGTT CATGAAGCGG CATGCCGGGT GGCATTATCC GCTCTTTCTG 
ATCGTCTTCT TCCTCAGTTC ATTCTGGCTC TCGACCGGGA TCCATCTCCT CTACTACAAG 
AGCCCAGACG CTTTTCGGGC TTACGCACGA GGAATCAGGG ACGGCCTCAG AGGACCGGCC 
CCTCTCCCGG AGACCCTCTA A

Protein sequence

MRDEPAVSIV LVNWNGWKDT VECLTSLSRL QYHRIQIVIV DNGSTDGSVE KIGDYCQGRL 
NVTSPFFPDQ PAVVAVSFSL LTAEEARSTG AVNAETGTVT VITNQRNLGF AEANNQGTRF 
ALRAFESDYV LFLNNDTIVD PGFLTAFIAV AKEDPSIGFL GPKTCYYDYQ GRRDVINFAG 
GELSLLTGNT VHIGQNQPDQ GQFDTQRTVD YVEGSCLLAR SSMLRQIGLL DPGYFVYYEE 
NDLVMRGREA GFSAVYVPTA VIWHKVSASS KKTPIKTYYM ARNRFWFMKR HAGWHYPLFL 
IVFFLSSFWL STGIHLLYYK SPDAFRAYAR GIRDGLRGPA PLPETL