Gene Moth_0453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0453
Symbol
ID	3830881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	454692
End bp	456773
Gene Length	2082 bp
Protein Length	693 aa
Translation table	11
GC content	61%
IMG OID	637828388
Product	LmbE-like protein
Protein accession	YP_429327
Protein GI	83589318
COG category	[S] Function unknown
COG ID	[COG2120] Uncharacterized proteins, LmbE homologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCGTCA GTGCCGTGAT CCCGGCTTAT AACGAAGAGA CCACCGTAGG CAGAATTATT 
GACACCCTGA AACAAGTAGC TGCAGTTACC GAAATCATCG TCGTCAGCGA CGGTTCCGAA 
GATGATACCG CTGCCGTGGC CCGCCACCAC GGGGCCAGGG TACTGGAGCT GGCCGTAAAC 
AGCGGCAAAG GGGCAGCCAT GACTGCCGGC GCCAGGGAGG CCAGGGAGGA CATCCTCCTC 
TTCCTGGATG CCGACCTGGA GGGACTGCTG CCGGACCACG TCCAGGCCCT CATCGAGCCC 
CTGCTGGCGG GCCGGGCCGA GATGAGCGTG GGCATCTTCA GCCGCGGCCG CTCCATGACT 
GACCTGGCCC AGGTAGTGGC TCCCCACCTT TCCGGCCAGC GAGCCATCCG CAAAGATCTG 
TTTTTAGCTA TCGGCGCCGA CAGGAGCCGT TTCGAGGTAG AGGTCCAGCT CACCAGCGAG 
GCCAGAGCCC GGAATTGGCG GGTAGAGAAG GTACCCCTGG TCAACATGAC CCATATTATG 
AAGGAAGAAA AAAGGGGCCT GTACCGGGGG GTAGTAGCCA GGATGGGTAT GTATAAAGAT 
ATTGCCGGCT TTTTCTGGCG CCTGACCAGG AAGAAGTTAA AGGCGCGGCC GGTAGCCGTG 
TTGCTGCTCC TGCTGTCGCT GGGGGTGACC TTTAACTACG ACACCCAGCG AGTGGCTTCC 
GCGGAAGCCG GCAGGATGCC TGATTTAAAC CTGCCGGCAG CAGGACAGCG CCTGCTGGTC 
GTTTCGCCCC ACCCTGATGA CGAGACCCTG GGCGCCGGCG GCTTGATTGC CAAGGCCAGG 
GCCCGGGGGG ATACCGTGAA GGTAGTATTT ATGACCAACG GCGATGGCTT CCGCCGGGGG 
GTAGAGACAA CCAGGGGCAT TTTGCCGACC AGTGCCGGTG ATTTTTTGAC TTACGGCGAG 
AGACGCCAGC AGGAAGCCAT CACCGCGCTG GGGAACCTGG GGGTGGGGCC GGCGGATATT 
ATCTTCATGG GTTACCCGGA CGGGGGGCTG GCCGCCATCT GGAGTAATTA CTGGCAGGAA 
GACAAACCCT ACCGCTCGGC CTGCACCCGC AAGGAGGCCG TGCCCTATAG ACTGGCCTTT 
AAACCGGGCG AACCTTATGC GGCCCCGGCC CTCCTCGCCG ACCTGGAGGA GATTCTCCGG 
GAGTACCGGC CTACAGATAT TTATGTTACC GACACTAACG ACAGCCACCC CGACCACTGG 
GCCACCGGGG CCTTCACCTT GGCGGCAGTG GGGGAGCTAA AGGGGGAAGA CCCTACCTTC 
AACCCCCGTA TCTATACCTT TGTCATCCAT ACCGGCATGT GGCAAATGCT GCCGGTATTT 
GACCGGGACC ATAAACCCCT CCTGCCCCCG GGGTATTTCC TGGCCCGGGG TACGCCCTGG 
TATAAATTGC CTCTGGCGCC GGCAATCCTG GAACTGAAAA AACAGGCTAT CGCCGCTTAC 
CGGACCCAGG AAATGGTCAT GCCCACTTTC CTGGCCAATT TTGAGCGGCC CAACGAGGTC 
TTCTCCCGCC TGCCGGACCA GGAGGTGATT ACCACAGCGA CGGGCATGAG TGTCGACGGT 
TGGGTTAAGG AATGGCCCCG GGATGCCGTC ATTGCCCTTG ACCCCGCCGG TGACCTGGTG 
ACAAAAAAAG TAGAGCGGGG CGGCGATCTC AAGGCGGCCT ACCTGCTCCA GTCCGGCCGG 
ACCACCTATT TGCGCCTGGA CACCTGGGGC CGGGTCGGTT TTCCGGTAAA TTACACCCTG 
AGCATCTACC TGTTGCCGGC TTCTCCCGGG GCCGGTAGCC AGCGCTTTAC CTGGTCCTGG 
GCACCCGGCG AGAAACAGGT CAGGTGGCTG ACCCGCCCGG CCGGTTACGA CCCGAATGCC 
ATCCGGGTAG CTTCCGGAGG CGACAGCCTG GAGATGGCCC TGCCGGACCT TATTCCTCCC 
GGCGAGCACT ACCTGATGTT CACCGCCGTC ACCTCTATCG GCAGGCTGCC CCTGGACCGG 
ATCCCCTGGC GCCTCGTAAA GATTAAGGGA AGCGATTTAT AA

Protein sequence

MGVSAVIPAY NEETTVGRII DTLKQVAAVT EIIVVSDGSE DDTAAVARHH GARVLELAVN 
SGKGAAMTAG AREAREDILL FLDADLEGLL PDHVQALIEP LLAGRAEMSV GIFSRGRSMT 
DLAQVVAPHL SGQRAIRKDL FLAIGADRSR FEVEVQLTSE ARARNWRVEK VPLVNMTHIM 
KEEKRGLYRG VVARMGMYKD IAGFFWRLTR KKLKARPVAV LLLLLSLGVT FNYDTQRVAS 
AEAGRMPDLN LPAAGQRLLV VSPHPDDETL GAGGLIAKAR ARGDTVKVVF MTNGDGFRRG 
VETTRGILPT SAGDFLTYGE RRQQEAITAL GNLGVGPADI IFMGYPDGGL AAIWSNYWQE 
DKPYRSACTR KEAVPYRLAF KPGEPYAAPA LLADLEEILR EYRPTDIYVT DTNDSHPDHW 
ATGAFTLAAV GELKGEDPTF NPRIYTFVIH TGMWQMLPVF DRDHKPLLPP GYFLARGTPW 
YKLPLAPAIL ELKKQAIAAY RTQEMVMPTF LANFERPNEV FSRLPDQEVI TTATGMSVDG 
WVKEWPRDAV IALDPAGDLV TKKVERGGDL KAAYLLQSGR TTYLRLDTWG RVGFPVNYTL 
SIYLLPASPG AGSQRFTWSW APGEKQVRWL TRPAGYDPNA IRVASGGDSL EMALPDLIPP 
GEHYLMFTAV TSIGRLPLDR IPWRLVKIKG SDL