Gene Moth_0199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0199
Symbol
ID	3832272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	195342
End bp	196490
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	66%
IMG OID	637828135
Product	aminotransferase, class V
Protein accession	YP_429077
Protein GI	83589068
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCCATTA TTTACCTCGA TAACAGCGCC ACCACAGCGG CTTTACCCGA AGTAGCAATC 
GCCGTGAAGG AAATGCTGAC GGAAAACTAC GGCAACCCCT CTTCCCTCCA CGGCCTGGGG 
ATAAAGGCGG AAAAGGCCCT GGGCGAAGCC CGGCGCCAGG TGGCCGGCCT CATCGGCGCC 
CGGCCCACGG AGATCTACTT CACCTCCGGC GGCACCGAGG CCAACAACTG GGCCCTGCTG 
GGGATAGCCC GGGCACGGCG GCGCCAGGGC AGGCACCTGA TCACCACGGC CATCGAACAC 
CCCTCCATCC TGGCCACCTG TCGGCGGCTG GAGGCCGACG GCTTTGAAGT AACCTACCTG 
CCGGCAGACG CCCGGGGGGT CATCCGCCTG GCCGACCTGG AAGCGGCCCT GCGGGAGGAC 
ACCATCCTGG TGAGCGTCAT GAGCGTTAAC AACGAGGTGG GTTCCCGGCA ACCTGTAGCT 
GACATCGCCC GCCTGGTCCA CAGCCGCAGC CGGGCCGTCC TGCACGTCGA TCACATCCAG 
GGCTACGGCA AGATACCCTT GAACTGCCAT GAAGCCGGCA TCGACCTGAT GTCCTTAAGC 
GGCCATAAAA TTCACGGGCC CAAGGGCGTG GGCGCCCTGT ACATAAAGGA AGGTTTGCGG 
CTGGAGCCCC TGCTGACCGG CGGCGGTCAG GAGGCCGGCC AGCGCTCTGG TACCGAGAAC 
ACTGCCGGCA TCGCCGGTTT CGGCGTCGCC GCCCAACTGG CCGCAGCCGA CTTTGCCCGG 
CGGACTGCCA GGATGCAGGA GATAAAGCTC GAACTCGCCC GGCGGCTGGT GGCCGAGATC 
CCCGGCGCCG TCATCAACGG CCCGCCCCCC GAGGAAGGCG CCCCTAACAT CATAAACGTC 
TCCTTCCCGG GGGTGCGGGC CGAGGTCCTG GTCCACATGC TGGAGCAGCG GGGCATCTAC 
GTCTCCACCG GCTCGGCCTG CCACTCCCGC AGGGAGAGCG CCAGCCACGT CCTCCAGGCC 
CTGCACCTGG AACGCTGGCG CCAGGACGGC GCCATCCGCA TCAGCCTGGG GGCCTTGAAC 
CGGCTGGAAG AGGTGGAACC TACCGTGGAG GCCTTTAAGG AATGCGTGCA AGAATTGTGG 
TCGTTATAG

Protein sequence

MAIIYLDNSA TTAALPEVAI AVKEMLTENY GNPSSLHGLG IKAEKALGEA RRQVAGLIGA 
RPTEIYFTSG GTEANNWALL GIARARRRQG RHLITTAIEH PSILATCRRL EADGFEVTYL 
PADARGVIRL ADLEAALRED TILVSVMSVN NEVGSRQPVA DIARLVHSRS RAVLHVDHIQ 
GYGKIPLNCH EAGIDLMSLS GHKIHGPKGV GALYIKEGLR LEPLLTGGGQ EAGQRSGTEN 
TAGIAGFGVA AQLAAADFAR RTARMQEIKL ELARRLVAEI PGAVINGPPP EEGAPNIINV 
SFPGVRAEVL VHMLEQRGIY VSTGSACHSR RESASHVLQA LHLERWRQDG AIRISLGALN 
RLEEVEPTVE AFKECVQELW SL