Gene Moth_1490 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1490
Symbol
ID	3831717
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1538302
End bp	1539492
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	60%
IMG OID	637829422
Product	L-aspartate aminotransferase
Protein accession	YP_430342
Protein GI	83590333
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	41
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACTTG CCCAGCGGGC TGCCGGTATC AGTCCTTCAC CCACCCTGGC CATTGACGCC 
CAGGCCAAAG CCATGAAGGC TAAAGGGGTG AAGGTAATAA ACTTCAGCGC CGGCGAGCCT 
GATTTCGGTA CACCGGAGCA TATCAAACAG GCAGCCATCG ACGCCCTGGC AGCCGGCTTT 
ACCCGTTACA CGCCGGTAGC CGGGATTCCT GAACTGCGCC AGGCAATATG CGCCAGCCTG 
GCTGCCCGGG GAGTGACCTA TGAACCGGCA GATATCGTCG TCTCCTGCGG CGCCAAGCAT 
TCCCTCTATA ATGCCATGCA GGTTTTACTT AACGCTGGTG ATGAGGTGAT CCTTAGCGCC 
CCCTACTGGG TAAGCTATTA CGAACAGGTT AAACTCGCCG GCGGTGTCCC GGTGGTAGTC 
ACCACCGGCC CCGACACCGG CTTTAAGTTG ACGCCAGGGT TGCTGGAAGC GGCCATTACC 
CCGCGGACAA GGCTCTTAAT CCTCAATTCG CCATGTAACC CAACCGGCGC TGTCTACAGC 
CGGGAGGAAC TGGCAGCCCT GGCTGAAGTA ATTGTTGCCC GGGACCTGAT AGTCATTTCC 
GATGAAATTT ATGCCGCCCT CCTCTACGAC GGCCTGACCC ACACCAGCAT CGCCTCCCTG 
GCGCCGGAGG TAAAAGAACG GACCATCCTC ATTGACGGGG TGTCCAAGAC CTACGCCATG 
ACCGGCTGGC GGATTGGCTA TGCCGCTGCG CCGCGGCCCG TGGCCAAAGC CATGACGGAT 
CTCCAGAGCC ACTCGACTTC CAATCCCACC TCCATCGCCC AGAAGGCGGC CGTGGCTGCC 
CTGACCGGCA GCCAGGAAGC CGTGGAAATG ATGCGTCGCG AGTTTGAACA ACGCCGCAAC 
CGCATCCTGG CGGGCCTGCG GGAGTTACCG GGCATCGAAT GCAACCAGCC CGGCGGCGCT 
TTCTACGTTT TCCCCTATAT CGGCAAGTTG TTCGGCCGCA AATTCCGGGG TCGGGTCCTG 
GGCAACTCCA CCGATGTCGC TACAGCCCTG CTGAATGAAT TCCAGGTGGC AGTGGTACCG 
GGCGTCGCCT TCGGCGCCGA ACCTTACCTG CGCCTCTCCT ATGCCACCTC CATGGACCAG 
ATCGAAGCCG GCCTGGAAAG ACTCCGGGCC TTTGTAACCG AACTGGAATA G

Protein sequence

MQLAQRAAGI SPSPTLAIDA QAKAMKAKGV KVINFSAGEP DFGTPEHIKQ AAIDALAAGF 
TRYTPVAGIP ELRQAICASL AARGVTYEPA DIVVSCGAKH SLYNAMQVLL NAGDEVILSA 
PYWVSYYEQV KLAGGVPVVV TTGPDTGFKL TPGLLEAAIT PRTRLLILNS PCNPTGAVYS 
REELAALAEV IVARDLIVIS DEIYAALLYD GLTHTSIASL APEVKERTIL IDGVSKTYAM 
TGWRIGYAAA PRPVAKAMTD LQSHSTSNPT SIAQKAAVAA LTGSQEAVEM MRREFEQRRN 
RILAGLRELP GIECNQPGGA FYVFPYIGKL FGRKFRGRVL GNSTDVATAL LNEFQVAVVP 
GVAFGAEPYL RLSYATSMDQ IEAGLERLRA FVTELE