Gene Mpal_2010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_2010
Symbol
ID	7271991
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	-
Start bp	2134242
End bp	2135324
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	64%
IMG OID	643570624
Product	protein of unknown function DUF201
Protein accession	YP_002467034
Protein GI	219852602
COG category	[R] General function prediction only
COG ID	[COG2232] Predicted ATP-dependent carboligase related to biotin carboxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.493163
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.206685
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAGGGAA ACGTCCTTGT CGCAGGGTTT ACGACACGCC ATGTCGCACG CTCTGCGGCC 
GCTGCCGGGT ACCGGGTCAC CGCCGTCGAC CACTTCTGCG ATCAGGACCT GAGCTGGTAT 
ACGGACGAAC AGATCCGGTT CGATGATCTC GACGATCTCC CTGATGCGAT CGAGGGGATC 
TGCCAGCGGC ACCAGTTCGA CTTCATGGTC GTCACCTCGG GGGCGGAGAC CGTCGACTGC 
CCGGTCCCGC TGATGGGAAC GCCGGCAGTG CAGGTCGAAC CGTTCCTCGA CAAGGGGATG 
ATGCAGGAGT TCTTTGAAGG ACTGGAGATG CCGATCCCAC CAAGGGCAGC ACCGGGCACC 
TACCCGGTCT TTCTCAAGCC GCTGACCGGG GCTGGCGGCT GGCGGAATGC GATCGTACAC 
AGCATTGACG AGGAACGGGC CTGGGAGGCG CTCTTCCCCG GAGCCCCATA CCTGGCCCAG 
GAGATCGTCG ACGGGGTGCC GGCGAGTGTC TCCTGTATTG GCGACGGGTC GAGGGCGGTG 
GCTGTGGCGG TGAACCGGCA GGTGATGCGC GGCGGGGACG AGGCGGCGTT CGGGTTCTCG 
GGATCGATGA CCCCGTTCGA CACGCCGATG GCTGCAGAGA TGGTCAGGGT TGCCGAACAG 
GTGGTCGCAG CCAGCGGGTG CGTCGGGTCG GTCGGGGTCG ACTTCATTGT TGGGGATGAT 
CTTCACCTGA TCGAGATCAA TCCGCGGTTC CAGGGGACCG TCGACACCGT CGAGATGGCC 
ACCGGATGCA ACCTCTTCGA TCTCCATGTC GCTGGATGCG AAGGGCGTCT GCCCGTTCTC 
CCGCCACGGG TGGCGGGGCG GTACGCGGTT CGGTCGATCC TCTTTGCAGA AGAGGAACTG 
GTCGTCACGG GAGACCTCAC CGGTCTGGCC CCGATCGTCG CGGATATCCC CTGGCCGGGG 
ACGGTGATCG AGGAGGGCGG AGCGATCGTC AGCGTGTACG GGCAGGGGCC GACTGAGGCC 
CAGGCACGCG CCTCGCTGGA TAACAATATT ATCACTGTGC GTACATATAT GAGCCAATGG 
TAG

Protein sequence

MKGNVLVAGF TTRHVARSAA AAGYRVTAVD HFCDQDLSWY TDEQIRFDDL DDLPDAIEGI 
CQRHQFDFMV VTSGAETVDC PVPLMGTPAV QVEPFLDKGM MQEFFEGLEM PIPPRAAPGT 
YPVFLKPLTG AGGWRNAIVH SIDEERAWEA LFPGAPYLAQ EIVDGVPASV SCIGDGSRAV 
AVAVNRQVMR GGDEAAFGFS GSMTPFDTPM AAEMVRVAEQ VVAASGCVGS VGVDFIVGDD 
LHLIEINPRF QGTVDTVEMA TGCNLFDLHV AGCEGRLPVL PPRVAGRYAV RSILFAEEEL 
VVTGDLTGLA PIVADIPWPG TVIEEGGAIV SVYGQGPTEA QARASLDNNI ITVRTYMSQW