Gene Moth_1955 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1955
Symbol
ID	3832306
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2033116
End bp	2034294
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	59%
IMG OID	637829886
Product	aminotransferase
Protein accession	YP_430796
Protein GI	83590787
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0276062
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGAAA AAATCTTTGC CGACAAAATG GCCAATCTGG GGACCGAAAC GGCCTTTATG 
GTCCTGGCCA AGGCCAAAGC TCTGGAAGCC CAGGGCAAGG AGATCATCCA CCTGGAAATC 
GGCGAACCCG ATTTCGCTAC CCCCCGCAAC ATAATCGACG CCGGCATCCG GGCCCTGAAC 
GAAGGTTATA CTCATTACAC CCCCGCCCCC GGGCTGCCGG AAGTCCGGGC GACCATTGCT 
GAGTATGCCA CCCGGCAGAA GGGCGTTCAT TACGACCCGG AAGAAGTCGT CATCGTTCCC 
GGGGGTAAAC CCATAATGTT CTTTACCATC CTGGCCCTGG TAAACCCGGG TGACGAGGTC 
ATCTACCCCA ATCCCGGCTT CCCTATTTAT GAATCCGTCA TCAACTTCGT CGGCGGCAAG 
GCAGTTCCCC TGCCCATCCG GGAAGAAAAC GACTTCCGCC TGGATGTAGA TGAACTGGCA 
GGGCTCATCA CCCCCAAAAC CAAACTCCTG ATCATCAATT CCCCCGCCAA CCCCACCGGC 
GGCGTCCTCA CGGCTGAAGA TATCGGCCGC ATCGCCGACC TGGTCCGGGG TAAGAACATT 
GTCGTCCTGG CCGACGAGAT CTACGATCGC ATCGTTTACG ACGGTGCCCG TCCCGTATCC 
ATTGCCGCCC AGCCGGGTAT GAAGGACTGG ACCATTATCC TGGACGGTTT CTCCAAGACC 
TACGCCATGA CCGGTTGGCG GATCGGCTAC GGCCTGATGC ACCGGGAGCT CGCCGACCGC 
ATCGCCCAGT TGATGGTCAA CTCCAACTCC TGCACCGCCG CCTTTACCCA AAAGGCTGCC 
CAGGAGGCCC TGACCGGACC CCAGGACGCC GCCGAGGCCA TGGTGGCCGA ATTTAAGAAG 
CGGCGGGACA TCATTGTTGA TGGCCTGAAC AGCATTCCCG GTATTACCTG CAAACGGCCT 
CTGGGTTCCT TCTACGTCTT CCCCAACATC AAGGGTCTGG GCCTCTCCAG CCAGGAGCTG 
GAAGCCTTCC TGATGGAAAA GGCGGGCGTA GCCGCCCTGA GCGGTACGGC CTTCGGTAAA 
TACGGGGAAG GCTACCTGCG TCTCTCCTAT GCCAACTCGG TGGAGAACAT CGAGAAAGCC 
CTGGAGAAAA TAGCGGCTGC CGTAAAGGAG CTGCGGTAG

Protein sequence

MFEKIFADKM ANLGTETAFM VLAKAKALEA QGKEIIHLEI GEPDFATPRN IIDAGIRALN 
EGYTHYTPAP GLPEVRATIA EYATRQKGVH YDPEEVVIVP GGKPIMFFTI LALVNPGDEV 
IYPNPGFPIY ESVINFVGGK AVPLPIREEN DFRLDVDELA GLITPKTKLL IINSPANPTG 
GVLTAEDIGR IADLVRGKNI VVLADEIYDR IVYDGARPVS IAAQPGMKDW TIILDGFSKT 
YAMTGWRIGY GLMHRELADR IAQLMVNSNS CTAAFTQKAA QEALTGPQDA AEAMVAEFKK 
RRDIIVDGLN SIPGITCKRP LGSFYVFPNI KGLGLSSQEL EAFLMEKAGV AALSGTAFGK 
YGEGYLRLSY ANSVENIEKA LEKIAAAVKE LR