Gene Mthe_1404 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mthe_1404
Symbol
ID	4463027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methanosaeta thermophila PT
Kingdom	Archaea
Replicon accession	NC_008553
Strand	+
Start bp	1504912
End bp	1506594
Gene Length	1683 bp
Protein Length	560 aa
Translation table	11
GC content	58%
IMG OID	639700422
Product	hydantoinase/oxoprolinase
Protein accession	YP_843819
Protein GI	116754701
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0145] N-methylhydantoinase A/acetone carboxylase, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTGTAG GAATAGACGT CGGTGGAACA ACAACCAACG CGGCGCTGGT GGACGGCAAT 
AAAGTTGTTA AGACCGCCAT CGGCCCGACA GACCATCAGG AGATCCTCGG CAGCCTGCTC 
AGAACAATGG ACAGGCTCAT CGAGGGTGTT GACGTTGAGA GGATCGAGAG GGTGGTGCTC 
AGCACCACGC TGATCACAAA CCTCATCGCG GAAGGAAAGG CGGATAAGGT CGGCCTGGTT 
CTGATACCCG GTCCCGGAGT CAATCCACGG GACTACAGGT TCAGGACAGA GCCTGTGATA 
CTGGATGGTG CGATCGACTA CAGGGGAAGA GAGATCGCGC CACTCAGGGA CGATCAGATA 
AGAGCGGCTG CGCAGAGCCT CGCCGACCAG GGGTACAGAA AAGTCGCAGT CGTGGGAAAG 
TTCTGCCAGA GGAATCATGA GCATGAGACG CACGTCAGGG AGATATTCTC GAAGGTCGCT 
CCCGCGATCG AGGTCGAGAT GGGACACAGG GTCTCAGGCC AGCTGAACTT CCCGCGGAGG 
GCTGCCACGA CAATGCTGAC CCTCGCGACC CGCGACCACT ACAGGCGGTT CGCGGAGCAG 
GCAGAGCGCG CCATGCGGGA TCGCGGAATA AGAGCTCCGA TATACATTCT TAAAGCGGAT 
GGCGGAACGC TCCCGCTTGA CAAATCTCTG GATAAGCCTG TTGAGACGAT ATTCTCGGGA 
CCGGCTGCAA GCGTCATGGG AGTGATGGCC CTGACCCCCA AGGGGCAGAC ATCAGTTGTA 
GTGGATATAG GAGGAACAAC AACAGATCTC GCTCTGATTC TCTCCGGAAA ACCCCTACTC 
TCATCGAAGG GCGCGAAGAT AGAGGACATG CTGACGCATG TAAGAGCTTT CGCTGTGCGC 
TCCATAGGGA TCGGCGGGGA CAGCGTCGTC AGAGTGTCTG ATGGAAAGAT CACTGTGGGT 
CCGGATCGAG CAGGGCCTGC ATTCGCGCTC GGCGGGCCGG AGCCGACGCC AACCGATGCT 
CTCATGGTTC TCGGTCACAC GAACCTTGGG GACGTGGCCC TTGCTAGGAA GGGCATTGGC 
ATAATAGCGA AGATCCTCAG ATGCAGCACC GAGGATGCGG CCAGAATGAT AGTTGATACT 
GTTGTGGAGA GGATAGTTGA TACCGTGAAC ATGATGTTTC TCGAGTGGGA GCAGGAGCCA 
GCGTACAGGA TCTGGGAGCT GCTTCAGAGG ACGAAGGCCA GACCGCAGAA TGTCGTCGGG 
GTTGGTGGAG CTTCGCCGCC GCTGGTGCCG CTGGTCGCGA AGAGGCTCAA TGCGAATGCC 
ATCATCCCGG AGCACGCACC CGTGGCAAAC GCTATAGGCG CCGCGGTCGC CAGGCCCACG 
ATGACTTTGA GCCTCAGGAT AGATACCGAG AGGGGCATGT ACACGGTCGA GGAGGATGGC 
ACGCTCGGCG AGGCGAAGGG GAGGAACCTC AGCCTCGAGG GAGCGCAGGA GATGGCGAGA 
CGGCTCCTGA GGGAGAGGGC CGAGCGCTTC GGAATCCACG AGTATGCTGA CGAGGCCGAG 
GTGGTGGACA GTGAGATCTT CAATATGGTC AGGGGTTGGT CGACTGTTGG GAAGCTTATC 
GATGTCAGGA TGGAGATCCC AGCAGGAATC ATCACATCAT GGAGGAGAGA TCATGGCAGC 
TGA

Protein sequence

MFVGIDVGGT TTNAALVDGN KVVKTAIGPT DHQEILGSLL RTMDRLIEGV DVERIERVVL 
STTLITNLIA EGKADKVGLV LIPGPGVNPR DYRFRTEPVI LDGAIDYRGR EIAPLRDDQI 
RAAAQSLADQ GYRKVAVVGK FCQRNHEHET HVREIFSKVA PAIEVEMGHR VSGQLNFPRR 
AATTMLTLAT RDHYRRFAEQ AERAMRDRGI RAPIYILKAD GGTLPLDKSL DKPVETIFSG 
PAASVMGVMA LTPKGQTSVV VDIGGTTTDL ALILSGKPLL SSKGAKIEDM LTHVRAFAVR 
SIGIGGDSVV RVSDGKITVG PDRAGPAFAL GGPEPTPTDA LMVLGHTNLG DVALARKGIG 
IIAKILRCST EDAARMIVDT VVERIVDTVN MMFLEWEQEP AYRIWELLQR TKARPQNVVG 
VGGASPPLVP LVAKRLNANA IIPEHAPVAN AIGAAVARPT MTLSLRIDTE RGMYTVEEDG 
TLGEAKGRNL SLEGAQEMAR RLLRERAERF GIHEYADEAE VVDSEIFNMV RGWSTVGKLI 
DVRMEIPAGI ITSWRRDHGS