Gene Mthe_0991 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_0991
Symbol
ID	4462867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	-
Start bp	1075697
End bp	1076938
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	54%
IMG OID	639700009
Product	amidohydrolase
Protein accession	YP_843416
Protein GI	116754298
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAATTC GCAGTGCATC CATCATTAGA AACGGGTCTC TGCTGAAGAA CATCGACATT 
CTCATCGAGG GGAACCGCAT CTCTGAGGTT GGAAGAGATT TGAGGCCGAA TGATGATGAG 
ATCATAGATG CAAGAAACAT GCTCGCAGTT CCGGGTCTTG TGAACAGCCA CACACACCTG 
GCCATGACGC TTCTCAGGGG ATACGCAGAT GATATGGAGC TCATTCCCTG GCTTCAGGAG 
AAGATATGGC CGCTGGAGGC GAGGTTGAAG CCATCTGATG TTCGTGCTGG AGTGAAGCTG 
GGCTGCCTGG AGCTGATAAG ATTCGGCGTG ACGTGCTACA ATGACATGTA CTACTTCATG 
GATGAGACTG CTGCTGCCAC CAGGGAGATG GGGATCAGGG GTGTGCTCTC AGGCGTGCTA 
TTCGATATGC GGCCGGAGTT CATCAATGAT GTCGAGCCAT TCATAAAAAA ATGGAGAGAT 
GACGATCTCA TAAAGCCGGC TGTGGGCCCG CATGCTGTCT ACACGTGTTC AGAGGAGACG 
CTTCTCAGGG CAAAGGATAT CGCGGAGAGG TATGATGTCA AGATCCACAT CCACCTCTCA 
GAGACCAGGG ATGAGGTCGA TACATTTGTG AACCAGCGGC ACATGAGCCC TGTGGAGTAT 
CTTGAAAACC TTGGGTTTCT CAGCGAGAGA GTGGTGGCAG CGCACTGCGT GTGGCTGACG 
CCGAGGGACA TCAGGATCCT TGCGGAGAGG CATGTGAACG TCGCCCACTG CCCGATAAGC 
AATCTCAAGC TCGCATCAGG CATCGCTCCG GTCGCGACCC TCATCGAGCA TGGGGTGAAC 
GTCTGTCTTG GAACGGATGG AGCTTCGAGC AACAACAACC TGGACATCTT CGAGGAGATG 
AAGGTTGCAG CCGTGGTCCA GAAGTGCTCT GTCGGGCGTT CAGCGATACT TCCGGCTGAT 
GCTGTCTGGC GGATGGCCAC AGAGAATGCA TACAAGGCAT TCTCCCTTGA TATGGGTATA 
AGGAGAGGGG CCCTCGCGGA TCTCGCCCTG ATCAACATGA GAAGACCATG GTTCATACCT 
GTGACATCGA TGATCTCACA TCTGGTCTAC AGCATGTCGG GAGAGGCGAG CTACACGATA 
TGCAACGGAA GGGTGCTCAT GAGGGATGGC GTGATCGAGG GTGAAGCTAA GATACTTGAT 
GAAGCCCAGC GCTGCTACGA GAGGCTTATC TCGGAAGAGT AG

Protein sequence

MLIRSASIIR NGSLLKNIDI LIEGNRISEV GRDLRPNDDE IIDARNMLAV PGLVNSHTHL 
AMTLLRGYAD DMELIPWLQE KIWPLEARLK PSDVRAGVKL GCLELIRFGV TCYNDMYYFM 
DETAAATREM GIRGVLSGVL FDMRPEFIND VEPFIKKWRD DDLIKPAVGP HAVYTCSEET 
LLRAKDIAER YDVKIHIHLS ETRDEVDTFV NQRHMSPVEY LENLGFLSER VVAAHCVWLT 
PRDIRILAER HVNVAHCPIS NLKLASGIAP VATLIEHGVN VCLGTDGASS NNNLDIFEEM 
KVAAVVQKCS VGRSAILPAD AVWRMATENA YKAFSLDMGI RRGALADLAL INMRRPWFIP 
VTSMISHLVY SMSGEASYTI CNGRVLMRDG VIEGEAKILD EAQRCYERLI SEE