Gene Moth_1228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1228
Symbol
ID	3833169
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1266096
End bp	1267775
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	53%
IMG OID	637829163
Product	copper amine oxidase-like
Protein accession	YP_430085
Protein GI	83590076
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000000175473
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCGTA TAAACACCCG CTTGCTACCT GTAACAATAA TTGCCCTCCT GCTTTGCATG 
GCTACATTTT TAAATACGGC CCTTGCCGCC TCGCCGCCGG CCAAGCAAAT AATTTTAACC 
CCGGGATCAA CGGAGATCTG GGTTGACGGG GAAAAAGCAA CCCTGCCAGC GGCACCCTAT 
GTTTCTGACG GCGTTCTCAT GGTCCCCCTG AGGAGGCTGG CTGACGAACT AGGCTTTACG 
GTCCAATGGC AAGAGGGACC ACCCCAGTCT ATTGTCGTAA ATTCCGGCAA CCTGCGGGCG 
GAAATGTACC CGGGCACCTG GGTAGTCTTT CTTACGGGTT CTGACTACCG GGCCGTAATC 
CTTCCGGCCG AGGTCCAGCA AAAAGATGGC CTCATCTTTG TTCCCACCGC TTTTTTCCAA 
GATGCCTTCC GGGTACCGAT GGCAGAAAGT AAAGGAGAAA AGGGAGTTTA CCTTTTGGGA 
AGCGATAATC AGCCGCCGAC TGCTTATTTT GACGTCCAGG AGCCGGTGTA TGCCGGGGAA 
GAAGTGAAGT ACATAGACAA AAGTAGCGAC GGTGACGGCG ATGCAATTGT CGAACGCCAG 
TGGTTAAACA AGAAGAATAT CTTCCCATCG CCCGGGGTTT ATTCTGTTAC CCTGAAAGTG 
AAGGACAGCC GTGGTAGCTG GAGCAAACCC TATGTGCGGG AAATAAAGGT CCTGCCGCGG 
CCGGCGACTG ATGTTCCCCG GCCGGGAGAA ATAGTAGAAA ATATCATGGG CCAGGCCGAA 
AATACCTTGA AGCCCGTAAA GGCGGATAGT GGTCCCCGGT TGCTTTTTAG TGACGACCCG 
GAATACATAG AGAAGCCGGG TATCCTCTAC CGGGATAAAT TAAAAGGGGA AGGCAGGCTC 
TATTTCTGGC ATGACGTTAA CTCCCCGGGC TCATTGAAAG TGTATGTCCT GGCTATAAAT 
ACCAGCCCCA GGGAAGCAGA AGTCAGTATC CTTAAGGAAG GTTACGGTGG GCCTTCGAAT 
AACGTATACC TTGTCGCCAG GACGGCCTTT ACGGCTTACT ACCATTCCCA GGGGCAGCGA 
AGGTATACCC TCAAACCAGG GCAAATTTTA GTGCTCAATC CCGGTGCCCC GGCAGCGGTA 
CGCTATCAAG TGGTCCACGG CATTATCGAC CTGAAAACCA GTGAGGAAAT TACGGTGGCC 
TTTGTGGCCG TCCCGGCTAC GGTAAATGTC TTGGAAGCCT ACAGCCGGCT GGGAGTGCTT 
CCCAGGGACG GTGTGCACGT CCGGGGTACG TTTGCCGCAG CCGACAGGGA AATGACCATC 
GACCTCCGGG GGGCAAAGAC CGGTTCCATT TTACTGGCTG ACGGCAGCGA TGATAAGTAT 
ATGGCCGGGG TGGATGGGAT TACCGGTTCG TCGGTCTGGA ACGCAGGTAA TTACGGCATG 
CTCTACCGGC TAAAAATCAA ATCAGATAAA AAAACAGGAG TTTATTTAAT CCCTGCCGGG 
GGCAGTTTTG GGGGCACCCT GATTTTTAAC GCCGGGGAGG TGTCGGTACC GTTAGAGGGC 
TTTATTTCCT CACCAGCCCA GGCTGTTTAT CTTGGAACCA CGGTCCCCGA GGGCATCACC 
GAGATGCTTT TTATGTCTCC CGGTGGTTCC TGCCTGCCGG TAAAGCTGTT GTTCAAGTGA

Protein sequence

MQRINTRLLP VTIIALLLCM ATFLNTALAA SPPAKQIILT PGSTEIWVDG EKATLPAAPY 
VSDGVLMVPL RRLADELGFT VQWQEGPPQS IVVNSGNLRA EMYPGTWVVF LTGSDYRAVI 
LPAEVQQKDG LIFVPTAFFQ DAFRVPMAES KGEKGVYLLG SDNQPPTAYF DVQEPVYAGE 
EVKYIDKSSD GDGDAIVERQ WLNKKNIFPS PGVYSVTLKV KDSRGSWSKP YVREIKVLPR 
PATDVPRPGE IVENIMGQAE NTLKPVKADS GPRLLFSDDP EYIEKPGILY RDKLKGEGRL 
YFWHDVNSPG SLKVYVLAIN TSPREAEVSI LKEGYGGPSN NVYLVARTAF TAYYHSQGQR 
RYTLKPGQIL VLNPGAPAAV RYQVVHGIID LKTSEEITVA FVAVPATVNV LEAYSRLGVL 
PRDGVHVRGT FAAADREMTI DLRGAKTGSI LLADGSDDKY MAGVDGITGS SVWNAGNYGM 
LYRLKIKSDK KTGVYLIPAG GSFGGTLIFN AGEVSVPLEG FISSPAQAVY LGTTVPEGIT 
EMLFMSPGGS CLPVKLLFK