Gene Mpal_1029 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpal_1029
Symbol
ID	7271763
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosphaerula palustris E1-9c
Kingdom	Archaea
Replicon accession	NC_011832
Strand	+
Start bp	1054947
End bp	1056263
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	61%
IMG OID	643569666
Product	amidohydrolase
Protein accession	YP_002466100
Protein GI	219851668
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.951911
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTGATA GAATGGGAAG AGAGAAAGCG TGCCTGATCA CAGGCACCTG TATTGAAGGA 
CGGCCTGTTG AGATTCTGAT CGATGAGACC GGGACGATTG CTGCGATCGA TGAGAAGATC 
AGCGGGTCGG AGCGCTCGAA TGCCGAGGTG ATCATCGATG GGTCTGGGAC CCTCGCGATG 
CATACGCTCG CGAACACGCA CACCCATGCC GCGATGTCCC TGCTTCGAGG GTACGCCGAC 
GATATGATCC TGCAGGACTG GCTCGGGCAG AAGATCTGGC CCCTCGAAGC CTGCCTGACC 
GGGGAGGACG TGTATTGGGG AACCCGACTC GCCTGCATCG AGATGATCCG GAGCGGGACC 
ACGGCCTTCA ATGATATGTA CTTCTTCATG GAGGAGGCGG CCCGTGCCGT CGATCATGCC 
GGGATCAAGG CCCAGCTCTG CTATGGGTTC ATCGACCTGA ACGATCACGA CAAGCGGGAG 
CATGAGATCA GAGCGACCGA GGCGCTGGTC ACCTCGATCA AAGGAATGCA GAACCCGCGG 
ATCAAACCGG CCGTCGGGCC GCATGCTGTC TACACGGTCT CACCGGAAGG ACTTGCATGG 
CTGGCCGCCT ACAGTGCGTC GGAACAGATC GGGATCCATG TCCACCTGTC AGAGACCGAG 
CAGGAGGTTC TCGATGCGCA GAAGAACAGT GGAAAGCGGC CGCCGGCGAT TCTCGACCAG 
GCCGGGTGCC TGACCGACCG GACGATCGCA GCCCACTGCT GCTGGCTCGA CCAGGCGGAC 
TGCCGGCTGC TTGCAGAGCG GGGGACAACG GTCTCGCATA ACCCGGCCAG TAATATGAAA 
CTGTCTGTGA ACAGGGCAAT GCCCTATCCC TGGCTCGTTG AGGCCGGGGT TCCGGTCACC 
CTCGGCACCG ACGGTTGTGC CTCCAACAAC AACCTGGACC TCTTTGAGGA GATGAAGATC 
GCGGCCCTGC TTCAGAAGTT CGCCCAGAAC AACCCGACCT GCCTGCCGGC AGAAGAGGCG 
CTCTCCATGG CCACTGTAAC TGGAACCCGG GCTCTCGGGT TCGGGAGCGG CCTTCTTGTA 
GTCGGGGAGC CGGCGGATAT CATGCTCATC GACAGAATGG TCCCCTGCAA CACGCCCCTC 
CACCACCAGA CCTCGAACAT GGTCTATGCC TGCAATGGCG GGGCCGTGAA GACGGTCCTC 
TGCAATGGGC GGGTGGTGAT GCAGGATGGG GTGATCCCTG GCGAAGAAGA GGTGCTCAAC 
AACGCCTCAC GAGCAGCAGC AGACCTGGTC AGGCGGGCTG CCGATCAGGC TGAGTGA

Protein sequence

MVDRMGREKA CLITGTCIEG RPVEILIDET GTIAAIDEKI SGSERSNAEV IIDGSGTLAM 
HTLANTHTHA AMSLLRGYAD DMILQDWLGQ KIWPLEACLT GEDVYWGTRL ACIEMIRSGT 
TAFNDMYFFM EEAARAVDHA GIKAQLCYGF IDLNDHDKRE HEIRATEALV TSIKGMQNPR 
IKPAVGPHAV YTVSPEGLAW LAAYSASEQI GIHVHLSETE QEVLDAQKNS GKRPPAILDQ 
AGCLTDRTIA AHCCWLDQAD CRLLAERGTT VSHNPASNMK LSVNRAMPYP WLVEAGVPVT 
LGTDGCASNN NLDLFEEMKI AALLQKFAQN NPTCLPAEEA LSMATVTGTR ALGFGSGLLV 
VGEPADIMLI DRMVPCNTPL HHQTSNMVYA CNGGAVKTVL CNGRVVMQDG VIPGEEEVLN 
NASRAAADLV RRAADQAE