Gene Moth_1820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1820
Symbol
ID	3832789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1879495
End bp	1880790
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	67%
IMG OID	637829750
Product	hypothetical protein
Protein accession	YP_430663
Protein GI	83590654
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0303] Molybdopterin biosynthesis enzyme
TIGRFAM ID	[TIGR00177] molybdenum cofactor synthesis domain

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTGGAG TAAACGCTTC CTTTAGCCTG GAGGAAGGGC GGGAACTCCT CCTGGCCGGG 
TTAAAACCGA CGGGAAGGGT GAAAATAAAA CTGGCTGAGG CCCCGGGCCG CATCCTGGCG 
GAACCGGTGG TGGCGCCGTG CTCCTTCCCG CCTTTCCCGC GTTCCCGGGT GGACGGTTAC 
GCCCTGGGAC TGCCCCCGGC CGCCGGCGGG GCATCGGGAA AAATCTACCG GCTGGTGGCT 
ACAGTAGCGG CAGGTAGCTG CCCGGCTGTC ACCCTGGGAC CGGGTACGGC GGCGGCTATT 
TTCACCGGCG CCCGGCTCCC GGAAGGCACA ATAACCGTTA TTCCCAGAGA ACTGGCGGAG 
CGCCAGGGGG ACCTGGTCAT AGTGCCGGAG CTGCCCCCGG GGGGCAGGTT CATGGAAGCT 
GCCGGATCGG AGGTGGCGGC CGGGGAAAGG GTCCTGGCCG CCGGCACTGA ACTGGGACCG 
GCGGAAATCG GCCTCCTGGC CGCCCTGGGC CTTACGGAAA TAACCGTCTA CCGTAGTCCC 
AGGGCGGTCC TGGCGTCCAG CGGCAGCGAA CTGGTGGAAT TGCCTGGCCT CCGGGGAGGC 
TGCCCCGGCG GCCGGCAGGC AGGTGGCGAG GCGATAAGCC CTGTTGCCAG CCAGGTTCGA 
GCACTCGGGC CCCGCATTTA TAATAGTAAT TTCTATGCGC TGGCGGCAGC CGCCAGCCGC 
GATGGCGCTC GGGTAATCCC CCTCGGGCCG CTGGCCGATG AACTGGAGGA ACAGGTAGAG 
GCTTACCGGA AAGCCCTGGA GGAGGGCGAT GTACTTCTAA CTACCGGTGG AGCCGGCGGT 
AGCATCCGTG ACCTGACGGC GGCGGCCTTT ACCGGTGCCG GGGGAGAAAT CCTCTTTACG 
ACAATCCGGA TGCGCCCGGG CCGGCGGGTG ATAGCCGCCC GCCGGGGGGA TAAATTACTC 
CTGGGCCTGC CGGGCAATCC ACCGGCAGCG CTGGTGGCTT ACTACCTCCT GGCGGCACCG 
GTGATTCGCG CCCTGGGGGG GAGGGAAGTC CTACCGGCAA CCTTCCCGGC GGTACTGACG 
GCGGCCATAG ATAAACCGAG GCCCGAACGG GCCTTTATCT GGGCCCGGGC CTGGCCCGGT 
ACGACCGGCT GGCAGGTAGC GCCCCTGCCG CGTCGCCCGG GGGGTATCCG CGCCGCTATT 
GGGGCCAACG CCCTCATTGA CCTCCCCGCC GGCCCGGCTC CTGGAGCCGG GGAAGAGGTA 
AGGGTGGTGC TGCTTACTGC CCGGGGTTCA CAATAA

Protein sequence

MAGVNASFSL EEGRELLLAG LKPTGRVKIK LAEAPGRILA EPVVAPCSFP PFPRSRVDGY 
ALGLPPAAGG ASGKIYRLVA TVAAGSCPAV TLGPGTAAAI FTGARLPEGT ITVIPRELAE 
RQGDLVIVPE LPPGGRFMEA AGSEVAAGER VLAAGTELGP AEIGLLAALG LTEITVYRSP 
RAVLASSGSE LVELPGLRGG CPGGRQAGGE AISPVASQVR ALGPRIYNSN FYALAAAASR 
DGARVIPLGP LADELEEQVE AYRKALEEGD VLLTTGGAGG SIRDLTAAAF TGAGGEILFT 
TIRMRPGRRV IAARRGDKLL LGLPGNPPAA LVAYYLLAAP VIRALGGREV LPATFPAVLT 
AAIDKPRPER AFIWARAWPG TTGWQVAPLP RRPGGIRAAI GANALIDLPA GPAPGAGEEV 
RVVLLTARGS Q