Gene Moth_0019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0019
Symbol
ID	3831892
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	18887
End bp	20053
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	61%
IMG OID	637827946
Product	Serine--glyoxylate transaminase
Protein accession	YP_428902
Protein GI	83588893
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0075] Serine-pyruvate aminotransferase/archaeal aspartate aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0000322298
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000185369
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGACTGACA AGCAGATCCT GCTCTTGCCC GGGCCGACGC CGGTGCCGCC GCAGGTGGCC 
CTGGCCATGG CACGTCCGGC GATAAACCAC CGCGGCCCGG AGTTTAAAGC CCTGTGGGCG 
GAAGTTACCT CGGGGTTAAA GGACGTTTTC CAGACCCGCG CGGAGGTGGT GATTTTAACC 
GCTTCCGGTA CAGGTGGCAT GGAAGCTGCC GTAGCCAATC TCATTTCCCC CGGTGAGAAG 
GTGCTGGTCG TGACCATCGG CGCCTTTGGC GAGCGCTTCG TCCAGATCTG CCGGGCCTTT 
AACGTGGAGG CGGAGGTCGT AGCCTTCCCC TACGGCCAGG CTGCCGACCC GGAGGTTATA 
GCAGAGCGTC TGGCAGCCGA CACCGGGCAT GAGATTAAAG CCATCCTGGT CCAGCATAAC 
GAGACCTCGA CAGGAGTTTT AAACGATATC CAGGCTATTA GCCGTGCCCG GGGGGATCAT 
CCGGCTTTGC TTATCGTGGA CAGCATCAGC GGCCTGGCGG CGGCTGATTT GCCCATGGAC 
GCCTGGCATA TCGATGTGGT TATCGCCGGT TCCCAGAAAG CCTTTATGCT GCCCCCGGGA 
TTAACCATGC TGGCTGTGGG CGAGCGCGCC TGGCAGGCGG CTGAGAAATG CTCCAACCAA 
CGTTTTTACC TGGATATTAA AAAAGCAAGA AATTCGGGCC TGAAGGGCCA GACGCCCTTT 
ACCCCGGCCG TTCCCTTGCT ATATGGTTTA CAAGAATCCC TGCGGCTGCT AAAGGCCGAG 
ACCCTGGCCG GCAGCTATGC CCGTCACGCT TTGATGCGGG ACATGGTGCG GGCCGGGGTT 
CGCGCCCTGG GCCTGAAGCT CCTGGCCGAC GAGGCAATAG CCTCGCCGGC GGTGACCGCT 
GTCTGTGTCC CAGAGGGGAT GAAACCGGCG GATATAATCA ATCCCCTGCG GGAAAGATTT 
GGCGTGGTCG TGGCCGGGGG CCAGGGAGCC GTTAAAGACC AGGTCTTCCG CATCGGCCAC 
TTAGGGTATG TGAGCTTTAA CGCCATCCTG GCCGGACTGG CCGCTCTGGA GGCCGTTCTG 
GCCGACGCCG GGGTACCGGT GACCCGGGGT GCGGCAGTGG CGGCAGCCAG TACTATTTTA 
AGTGAAAGTG AGGCTGTAGA TAAGTAA

Protein sequence

MTDKQILLLP GPTPVPPQVA LAMARPAINH RGPEFKALWA EVTSGLKDVF QTRAEVVILT 
ASGTGGMEAA VANLISPGEK VLVVTIGAFG ERFVQICRAF NVEAEVVAFP YGQAADPEVI 
AERLAADTGH EIKAILVQHN ETSTGVLNDI QAISRARGDH PALLIVDSIS GLAAADLPMD 
AWHIDVVIAG SQKAFMLPPG LTMLAVGERA WQAAEKCSNQ RFYLDIKKAR NSGLKGQTPF 
TPAVPLLYGL QESLRLLKAE TLAGSYARHA LMRDMVRAGV RALGLKLLAD EAIASPAVTA 
VCVPEGMKPA DIINPLRERF GVVVAGGQGA VKDQVFRIGH LGYVSFNAIL AGLAALEAVL 
ADAGVPVTRG AAVAAASTIL SESEAVDK