Gene Tmz1t_0088 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tmz1t_0088
Symbol
ID	7083471
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thauera sp. MZ1T
Kingdom	Bacteria
Replicon accession	NC_011662
Strand	+
Start bp	98951
End bp	100450
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	71%
IMG OID	643697135
Product	AMP nucleosidase
Protein accession	YP_002353784
Protein GI	217968550
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0775] Nucleoside phosphorylase
TIGRFAM ID	[TIGR01717] AMP nucleosidase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGGCC ACGCCCCCCA CTTCGACGTC GAGGACTTCG CCGATCCGGC CGCGGCGCTG 
GCCCGGGTGC ACGAGATCTA CGACCTCGCG GTCGACCACC TGCGCCGCGG CCTGCAGCAC 
TACGTCGACG GCGCCGACAT CGGCCGCCAC GTGCGCGCCT GCTACCCGCT GCTGCGCGTG 
CGCACCGACA CCGTGGCGCG CGCCGATTCG CGGCTGTCCT ACGGCTTCGT CGCCGGGCCG 
GGCGTGTTCG AGACCACGCT GACCCGGCCC GACCTGTTCG CGGACTACTA CCTGGAGCAA 
TTCCGCCTGC TGGTGCAGAA CCACGGCGTA GCCTTGCAGG TGGGCAGCAG CACGCAGCCC 
ATCCCGGTGC ATTTCGCCCT GCCCGAGCAC GACTACCTGG AAGGCCACCT CGGCCCCGAG 
CGCCGCCGCC TGCTGCGCGA TCACTTCGAC CTGCCCGACT TGGGCGCCAT GGACGACGGC 
ATCGCCAACG GCACCTTCGA GCCCGGCCCC GGCGAACCGC ATCCGCTCGC GCTGTTCACC 
GCGCCGCGGG TGGATTACTC GCTGCACCGG CTGCGCCACT ACACCGGCAC GCGGCCGGCC 
TTCTTCCAGA ACTTCGTGCT GTTCACCAAC TACCAGTTCT ACATCGACGA GTTCATCCGC 
CTCGGCCACG AGCTCATGGC CGACACCGCC TCCGGCCACG GCTACGAGGC CTTCGTCGAG 
CCGGGCAACG TGCTCACCCG CCGCGCCGAC CTTCCGCCGC AGGCCGAGGA CGCCGATGGC 
ACCCCGCCGC CGCGCCTGCC GCAGATGCCG GCCTACCACC TGGTGCGCGG CGACCACGCC 
GGCATCACGA TGGTGAATAT CGGCGTCGGC CCGGCCAACG CCAAGACCAT CACCGACCAC 
ATCGCGGTGC TGCGCCCGCA CGCCTGGATC ATGCTCGGCC ACTGCGCCGG GCTGCGCAAC 
AGCCAGCATC TGGGCGACTA CGTGCTCGCC CACGGCTACG TGCGCGAGGA CCACGTGCTC 
GACGAGGAGC TCCCGCCCTG GGTGCCGATC CCGCCGCTGG CCGAGGTGCA GGTCGCGCTC 
GAGGCCGCCG TGGCCGAGGT CACGCAGCTG TCCGGCTACG AGCTCAAGCG CCTGATGCGC 
ACCGGCACCG TCGCCAGCAC CGACAACCGC AACTGGGAGC TGCTGCCCTC GCACGGCATG 
TCGAGCAGCC CGGAGCGCCG CTTCAGCCAG AGCCGCGCGG TGGCGCTCGA CATGGAATCC 
GCCACCATCG CCGCCAACGG CTTCCGCTTC CGCGTGCCCT ACGGCACCCT GCTGTGCGTC 
AGCGACAAGC CGCTGCACGG CGAGATCAAG CTGCCCGGCA TGGCCGACAA GTTCTACCGC 
GAGCGGGTGG ACCAGCACCT GCGCATCGGC ATCCGCGCGC TCGAGCAGTT GCGCGAACAA 
GGCGTCGACC GCCTGCACAG CCGCAAGCTG CGCAGCTTCG CCGAGGTGGC GTTCCAGTAG

Protein sequence

MNGHAPHFDV EDFADPAAAL ARVHEIYDLA VDHLRRGLQH YVDGADIGRH VRACYPLLRV 
RTDTVARADS RLSYGFVAGP GVFETTLTRP DLFADYYLEQ FRLLVQNHGV ALQVGSSTQP 
IPVHFALPEH DYLEGHLGPE RRRLLRDHFD LPDLGAMDDG IANGTFEPGP GEPHPLALFT 
APRVDYSLHR LRHYTGTRPA FFQNFVLFTN YQFYIDEFIR LGHELMADTA SGHGYEAFVE 
PGNVLTRRAD LPPQAEDADG TPPPRLPQMP AYHLVRGDHA GITMVNIGVG PANAKTITDH 
IAVLRPHAWI MLGHCAGLRN SQHLGDYVLA HGYVREDHVL DEELPPWVPI PPLAEVQVAL 
EAAVAEVTQL SGYELKRLMR TGTVASTDNR NWELLPSHGM SSSPERRFSQ SRAVALDMES 
ATIAANGFRF RVPYGTLLCV SDKPLHGEIK LPGMADKFYR ERVDQHLRIG IRALEQLREQ 
GVDRLHSRKL RSFAEVAFQ