Gene Moth_1790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1790
Symbol
ID	3832456
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1845558
End bp	1846844
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	57%
IMG OID	637829715
Product	copper amine oxidase-like
Protein accession	YP_430634
Protein GI	83590625
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCTGTCA TTAATCGCTG CATTATTAAG AAGGCTGCTA CGTTGCTCTT GTGTGCCAGT 
TCTCTGGCAG TAGTGCCGGT GCCTGCCGCT GCTGCCAGCG AAAGCGTTAA ACTGGTGATT 
GACAACAAAC CACTGACAGT ACCGGCAGGG GACCAGGGAG CTTTTATAAT GGGGAACAGG 
ACCTACGTTC CTTTAAGGAT CATCAGTGAA AAACTGGGAG CCAGGGTGGA CTGGCAACAG 
GATGCCAATC GGGTTATTAT CACTACCAGA GAAACGCCAT CGGTTCCACC CCCGGCGGAT 
GATCGAAAGA ATCAGGGAGA GGTACAGATT ATCATTGATG GTAAGATTTT ACAACTCCCT 
CCTTCTCTGG GGCGCCCTTA CATAACCCCT GCAGGGCGGA CAGTAGTTCC CCTGCGGGCG 
GTGGGCGAAG CCCTCGGTTG CGAAGTTAAC TGGGTGGCCT CCACCAGTAC AGTAGAAATT 
AGATCCGCTA CTTATAAACT GCTGCTAGAG TTAGCCGGTT ACCGAAGCAA CCTGCGGTTG 
CTGGACGGGA CAGTAATCAA CTCCGCCGAA CTCTTAAAGA TGGATCCCTC ATCTTTCGGC 
CGGGAACAAC TGCAGCAGTT CCGGGAATTC CTGGGGTACC TCAAGAAGTA TGACCAGCAG 
GTCAAGTTGC CCGACGGCAC GGTGTTAAAC GTCGCCGATA TCACCATCGA GGGGCAACCG 
GTAGCCAGCG CCGCCCAGCT CCGGGCCTGG ATCGCCAGTG AAATCCCCCG CCTGCGGGTC 
AAGATGCAGG AACAGTACCA CCGCGACCTG CTTCCCATCC CGGATCTGGC CGAACTGTAC 
CTGCGGCTCG GCGCCGAGTA CGGCATCCGC GGGGACCTGG CCTTTGCCCA GGCGGCCAAG 
GAGACCAACT TCTGGCAGTT TACCGGGAGC GTCAAGCCCG ACCAGAATAA TTACTGCGGC 
CTGGGGGCCC TTAGCAGTCC CAATACGGGG AATGAGCCCC TTAATGGCGC CGATCCCACT 
AAAGTCCGGT TCGCGCCCGG CGTCTACGGG GCCATCTTCG CTTCCCCGGA AATCGGGGTC 
GAAGCCCATA TTCAACACCT TTATGCCTAC GCCACTAAAA AACCCTTGCC CCCGGGTAAG 
GTGCTCTATG ACCCGCGCTT CAATTTGGTA CAGCGCGGCT CCGCCACCAC CTGGCAGGGA 
CTCAACGCCC GTTGGGCGGT TCCGGGCATT ACTTACGGCC AGAGCATTAT TGAGGATTAC 
TGGCTGAAAG CCCTGGCGGC GAAATAA

Protein sequence

MPVINRCIIK KAATLLLCAS SLAVVPVPAA AASESVKLVI DNKPLTVPAG DQGAFIMGNR 
TYVPLRIISE KLGARVDWQQ DANRVIITTR ETPSVPPPAD DRKNQGEVQI IIDGKILQLP 
PSLGRPYITP AGRTVVPLRA VGEALGCEVN WVASTSTVEI RSATYKLLLE LAGYRSNLRL 
LDGTVINSAE LLKMDPSSFG REQLQQFREF LGYLKKYDQQ VKLPDGTVLN VADITIEGQP 
VASAAQLRAW IASEIPRLRV KMQEQYHRDL LPIPDLAELY LRLGAEYGIR GDLAFAQAAK 
ETNFWQFTGS VKPDQNNYCG LGALSSPNTG NEPLNGADPT KVRFAPGVYG AIFASPEIGV 
EAHIQHLYAY ATKKPLPPGK VLYDPRFNLV QRGSATTWQG LNARWAVPGI TYGQSIIEDY 
WLKALAAK