Gene Moth_0460 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0460
Symbol
ID	3830889
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	462427
End bp	463650
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	60%
IMG OID	637828395
Product	amidohydrolase
Protein accession	YP_429334
Protein GI	83589325
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000000769094
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGATT TGCTAATCCG AAGAGCAAGG CTCATGGACG GCCAGGGGAC AGTGGATATA 
GCCATCAAAG ACGGATATAT TGTTGCTGCC GGCAATAATG TGGCGGGGTC GGCCCGGCAG 
ATGGTTGATG CCTCCGGCAG GCTCCTGATA CCGGCCTTTG TCGACGCCCA TACCCACCTG 
GATAAAGCCC TGACGGCGAC AGACGGCGGC GCCGGTTCCC TGGAAGCAGC CATCGAAGAC 
TTCCAGCGCC GGAGTAAAGA TATAGATAAA AACGACCTGC TGGCCAGGGG CCGCCAGGTA 
CTGCGGTTGG CCCTGCGCCA CGGTACCACA GCCATGCGCA CCCACATCAC CGTCAGTGAG 
AACCTGGGCC TGCGGGGCAT TGAGGCTGCC CTGGAATTGA GGGAAGAGTT TGCCGGTAAG 
GTTGACCTCC AGGTGATTGC CATGTTCAGC GGTCCGGAGC CGGAGCCGGC ACCCCCTTTA 
AAGGAACTCC TAGAGGAAGC CCTGCGGCTG GGGGTAGACG GCCTGGGCGG GGCACCCCAT 
CTCTCGCCTG GTATGCAACA ATGGGTGGAC TATATCTTCG AACTGGCCGG CAAATACGAT 
GTTCCCATTG ACCTGCACGC CGACGAGACT GACGCTCCTT CGGTGGCTTC CCTGGAGTAT 
ATAGCCAGTA AGACTATTCA GGCAGGTTAC CAGGGCCGGG TGGTTGCCGA CCACTGCTGT 
GGCCTGGCGG CAGTTGATGA AGCTACTGCC GGCCGTACCA TAGCCGCCGT CAAGGAGGCC 
GGCCTGAGTA TCATTACCTT ACCCTCCTGC AACCTCTACC TGATGGGCCG TAACGATAAA 
GGACTGGTCC GCCGGGGGGT GACCCGGGTA CGGGAACTCC AGGCCGCCGG CGTCAATGTC 
GCCTACGCCT CCGACAACAT CCGCGATGCC TTCCGGCCCT TTGGTAATGC CAACATGCTG 
GAGGAAGGCC TGATCACCGC CCAGGTTTTG CAGATGGGTA CCCCGGCGGA GCTCGAACAG 
GTCATGAAGA TGGGCACCTA TAACGCCGCC GCTGCCATGG GATTGCAGGA TTACGGCATC 
AAGGTCGGCG CCAGGGCCGA CCTGGTCCTC CTGGATGCCA CCACCCCGGC CGGGGCGATT 
ATAGGCCAGG TGGAGAAGGT CTGCGTCATT AAAGGCGGCC GGGTGGCCGT GCGCAATGAT 
AAAAAATCCG ATATCATTAT CTAA

Protein sequence

MNDLLIRRAR LMDGQGTVDI AIKDGYIVAA GNNVAGSARQ MVDASGRLLI PAFVDAHTHL 
DKALTATDGG AGSLEAAIED FQRRSKDIDK NDLLARGRQV LRLALRHGTT AMRTHITVSE 
NLGLRGIEAA LELREEFAGK VDLQVIAMFS GPEPEPAPPL KELLEEALRL GVDGLGGAPH 
LSPGMQQWVD YIFELAGKYD VPIDLHADET DAPSVASLEY IASKTIQAGY QGRVVADHCC 
GLAAVDEATA GRTIAAVKEA GLSIITLPSC NLYLMGRNDK GLVRRGVTRV RELQAAGVNV 
AYASDNIRDA FRPFGNANML EEGLITAQVL QMGTPAELEQ VMKMGTYNAA AAMGLQDYGI 
KVGARADLVL LDATTPAGAI IGQVEKVCVI KGGRVAVRND KKSDIII