Gene Moth_1945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1945
Symbol
ID	3832437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2018932
End bp	2020032
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	63%
IMG OID	637829876
Product	aminomethyltransferase
Protein accession	YP_430786
Protein GI	83590777
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0404] Glycine cleavage system T protein (aminomethyltransferase)
TIGRFAM ID	[TIGR00528] glycine cleavage system T protein

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000285507
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCCGATT TAAAAAAGAC GCCCCTCTAC GGGGAGCACG TGGCTGCCGG GGCCAAAATG 
GTGGAATTCG GCGGCTGGTT GATGCCCGTC CAGTACAGCA GCATTATTGA GGAACATCAG 
CGGGTGCGTA ACTGTGCCGG GCTCTTTGAC GTCTCCCATA TGGGGGAGAT TACCATAAAG 
GGACCTGACG CCCTGGCGCT GGTCCAGAAG CTGCTTACCA ACGATGCCGA CCGGGCCACC 
GGGGACAGGG TCATCTACAG CCCTATGTGT TACCCGGACG GGGGCGTAGT CGACGACCTG 
CTGGTCTATC CCCGGGGAGA AGGGGAATAT CTCCTGGTAG TCAACGCCGG TAACATTGAC 
AAGGACTTTG CCTGGATCCA GGAGAACGCT AGCGGTTTCC GGGTTGAGGT CAGCAATATC 
TCCGCAGCTA CAGCTCAACT GGCCCTCCAG GGGCCACGAG CCCTGGAAAT TCTCCGGCCC 
CTGACGAGGG TCGACCTGGC CTCCCTGGGT TATTACCGCT GGACCGAGGG CCAGGTTCTG 
GGGGTTCATT GCCTGATCTC CCGCACCGGC TACACCGGCG AAGACGGTTT CGAGCTTTAC 
TTTGAGGCGG CCGCAGCCCC TACCATGTGG CGGAATATCC TGGCCGCCGG CAGGGAGGCA 
GGCCTGGTCC CGGCCGGACT GGGGGCCAGG GATACTCTAA GGCTGGAGGC GGCCCTGCCC 
CTTTACGGCC ACGAGTTGGG CCCGGACATC AGCCCCCTGG AGGCCGGTTT GCACCGCTTT 
GTCCGCCTGG AGAAGGGCGA ATTTAACGGG AGGGAGGCCC TGGCAGCCCA GCGGGAAGCC 
GGGGTCAGGA GGCAACTGGT GGGACTGACC ATGATCGACC GGGGGATCCC CCGGCCGGAA 
TACCCCGTCC TGGCGGCAGG CAAGGAGATT GGTTACGTTA CCTCAGGTTC CCTGGCGCCA 
ACCCTGGGAC AAAATATCGC TCTGGCCCTG GTGGCGGCAG GAACTGTCTC TACCGGCGGC 
GAAGTAGAAG TGAGCATCCG CGGCCGTGTC AACCGCGCCC GGGTGGTGAA ACTCCCCTTC 
TATCGCCGCC CCAAAAAGTA A

Protein sequence

MADLKKTPLY GEHVAAGAKM VEFGGWLMPV QYSSIIEEHQ RVRNCAGLFD VSHMGEITIK 
GPDALALVQK LLTNDADRAT GDRVIYSPMC YPDGGVVDDL LVYPRGEGEY LLVVNAGNID 
KDFAWIQENA SGFRVEVSNI SAATAQLALQ GPRALEILRP LTRVDLASLG YYRWTEGQVL 
GVHCLISRTG YTGEDGFELY FEAAAAPTMW RNILAAGREA GLVPAGLGAR DTLRLEAALP 
LYGHELGPDI SPLEAGLHRF VRLEKGEFNG REALAAQREA GVRRQLVGLT MIDRGIPRPE 
YPVLAAGKEI GYVTSGSLAP TLGQNIALAL VAAGTVSTGG EVEVSIRGRV NRARVVKLPF 
YRRPKK