Gene Moth_2232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2232
Symbol
ID	3831277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2326753
End bp	2328183
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	46%
IMG OID	637830152
Product	hypothetical protein
Protein accession	YP_431062
Protein GI	83591053
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00123188
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.00000000989665
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGGTAAACG GTAGTACCAG TACCGCTACC ATCATTAGTT TATTAGATGG TATCGAGAAT 
TTCAACACTC TTGAAGAAGT TATCCTGCAA ATAGCCAGGA GGTTATTGGT AGCCGTACTG 
GAAGCCCTGG ATGATACCCT TATGCCGGCA AAACCTAAGG GATATAAGAT AGCTGGGTTC 
CGCTACCGCA CAATCACCTG CCTGTACGGG GATATAACCT TTAAGCGCCG GCTATATGTT 
AAAGCAACGC GCAAAAAGAA AAGAGGGGAA GGAAGGTTTC TATTAGACGA AGCCCTAAAC 
TTACGCCAAG GAAAGCGTCT GACAGGAAGA CTGCTCAAAT TAGCCGTATC GCTGGCAACC 
CGGTTACCCT TCAGGCAGGC AGCGGAAATA ATGGCCGAAG CAGGGATGGG CCAATTAAGT 
CATATGACCA TCCATAGCGA AGTAAAACGA AATGGACTGG AACAAAAAGA ACTGCAAGAA 
GCCCTGCGCA ATAATCTATT CATGAGCGGG GAAGAGCCCC AAGGCAAAAA GAAAAAAGTA 
CCGGTACTAT TTATCGAAGC CGATGGTATA ATGATCCCGC TGCAAAGGAG CAAGCAAGAC 
CGGATAGAAG TCAAAGTAGG AATAGTTTAC GAAGGGTGGA TAGAAAAAGG GAATGCCCGG 
CATCTCAAGA ACCCGCGGGT AGTGATGGGC ATCTATGAAG ATGGAGAACA ATTTTGGGAA 
GCCCTCACCA CGGAAATAGC CAGGTACTAC GAGATAGACG AAAAAACAAT ATATGTCGTC 
AATGGCGACG GAGCCAGCTG GGTCCAGAAG ACAGCCAAAG AACAGTTACC AGGAGCCATC 
GTACAATTAG ACCGCTACCA CCTCCACCGG GATATAAGGC AGGCATATGG GAACGAAACA 
GCGCAGGGAT TAATGAAGAC TTTAGCCAAA GGTCAAGAGC AGGTCTTTTT AGACACCCTG 
GAAGCACTCA TAGAAGAAGC ACCGAACCGC AAAAACAAGC AACAATGCCA AAAAGTATAT 
GACTACTGTC AAAGATATCG CGATAACTTG TTAGATTACC GCTTGCGGTT ACCACGACAG 
CTGGAAGGGC AAAAGTTATA CGGGATGGGC GTAGCCGAAA CAACAGTAGA CAAAAAAATA 
GCCATCCGCA TGAAAAAGAG GGGGATGAGC TGGAGCGAAG CAGGAGCAAC GGCCATGGTA 
GCATTACTAA TGCTCAAAGC CAATGGAGAA TTAGCCGCAT GGTTAGAAAA AAAGATGCCA 
CAAGTAGAAA AGAATCCCGC CAAGGTAGTA AAAGAAAAGA AGATAAGTAA AGAAGACGTA 
GAAGAATGGT TAAGGAAGAG AGTACCAGCC CTTGTTGGCC CTGAGGCGGG AACAGATTGG 
GTTAAATATA CCATGAGGCA ACTAACAAGA ATTAGTGGAG CTATATTCTA A

Protein sequence

MVNGSTSTAT IISLLDGIEN FNTLEEVILQ IARRLLVAVL EALDDTLMPA KPKGYKIAGF 
RYRTITCLYG DITFKRRLYV KATRKKKRGE GRFLLDEALN LRQGKRLTGR LLKLAVSLAT 
RLPFRQAAEI MAEAGMGQLS HMTIHSEVKR NGLEQKELQE ALRNNLFMSG EEPQGKKKKV 
PVLFIEADGI MIPLQRSKQD RIEVKVGIVY EGWIEKGNAR HLKNPRVVMG IYEDGEQFWE 
ALTTEIARYY EIDEKTIYVV NGDGASWVQK TAKEQLPGAI VQLDRYHLHR DIRQAYGNET 
AQGLMKTLAK GQEQVFLDTL EALIEEAPNR KNKQQCQKVY DYCQRYRDNL LDYRLRLPRQ 
LEGQKLYGMG VAETTVDKKI AIRMKKRGMS WSEAGATAMV ALLMLKANGE LAAWLEKKMP 
QVEKNPAKVV KEKKISKEDV EEWLRKRVPA LVGPEAGTDW VKYTMRQLTR ISGAIF