Gene Moth_2237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2237
Symbol
ID	3831283
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2334040
End bp	2336394
Gene Length	2355 bp
Protein Length	784 aa
Translation table	11
GC content	57%
IMG OID	637830157
Product	hypothetical protein
Protein accession	YP_431067
Protein GI	83591058
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.00266274
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTAGCA GGACGAGTGA AATGTTGGCC AATACTCTGC TGGAGGCTGT GCGCGATTCA 
TTGCTTCGAG CCGGCCGGTA TGACTCTGCG ACCATTGTCC CGCCGGCAGC GATTCTCTGG 
ACCGATGCCG ACGGCCAGTG GCAGCCCCTG GTATCCCAGT TGCGCCCGCT TATGCCGGAG 
CTTTTAACCC TGGGAGATTA CAACCCGGAA GAAAAAACCG GGCCGGCAAT CTGGCTGCGG 
TGTGTTATTG AACGAATGCT ACCTGATGTT GAACTACCGG ATAAAGCCAT TCCTATCATT 
TACCTGCCCA ACGTTAGCCG GCAGGTGCTC CGGGCCGGTG AGGAGTGCCC GGAAAGCCTC 
AAACCGCTGG TGGAACTGCA GTACCGCGGG ACGGTTTGGA CCCAGCGCAA CGGTAAAGAC 
TGGACAGTTG AGGCGTTTCT TGTCTCTGAA GATGGCCTGG GCCTGGATGT GGCTAAAGAT 
AAACAGACCC GCCAGGCGAT GCTTCGGGCA CTACCCCAAC TGGCCACCGC TCCTGTCGCA 
CGCCTGCGGG GCAAACGCCT GGAGGCCGAG GATTTTGACA GGTTGATGGT GGCAGATACC 
CAGCGGGACT TGCTGTCATG GCTCAGCGAC CCGGCTCGTA CCCGCGAAAA ATGGGGTGAA 
GAGAAGTGGA TGGCCTTTTG CTCCCGCTGT AAGGTTGAAT ATGAAATCGA CCCGGATAGG 
GATGGCGAAA TTGCTGTCGC CGAGAAAATG GGATTGCAGG ATAATGAAGC CTGGCAGGGA 
TTGTGGCGCA GGTATGCAGA AGCCCCGGCC CTTTACCCCG GCATCCCCGC AATTTTGCGG 
CGCGCCAAAC CATCAAGATT GTTCGTTAAC CGGGAGCCCT GGCCGGATGA AAACGAAGCT 
GAAGAGGAGG CCTTAAGGCA AAGCCTTTTG GAGCTGGAAA AATTATCTTC CCCTGATGCT 
AGGCAAAAAA TCGAAGAACT CGAGAAGGAA CACGGCGAGC GGAGGGAGTG GATCTGGGCC 
CAGCTGGGAC AGAGCCCCCT GGCCGGGGCT TTAAAGCACC TGGTGACCCT GGCGCGAAAG 
ACTGCCCGAG GCCTGGGAGG TGACATGCCC CAGGCAATGG CCGAACTATA CATCGAGGGC 
GGGTATCTGG CCGATGATGC CGTCTTACAG GCAACTGGCA GCGTAAAATC ATTAGAGGAT 
GCGCAGGCAA TACAGGCCGC TGTCCGCAGT ATCTACCTTC CCTGGCTGGA GGATGTAGCC 
CGGCATTTCC AGGATTTGAT TAAAACCTTC CCTTTGCCGA ACGCTGATGA TAAAGACCGT 
ACTTTAATTG CCGCCAATCC CGGGCAGTGT TTGCTCTTTA TAGACGGGCT CCGCTTTGAC 
ATTGCCCGGC GACTGGTTGC CATGGCTGAA GCAAGACAGC TCCGGGTAAA TATAAATTGG 
CGCTGGGCCG GACTGCCCAC GGTAACGGCA ACGGCAAAAC CGGCAGCCTC CCCCATAGCA 
GGAAAGCTTT CCGGCCATTT ACCCGGCGAA TACTTTATTC CAGAGATTGC CGGGGCTAAT 
CTCCCCCTGA CTCCCGACCG GTTTCGCAAG CTCTTAGCGG AAGCAGGCTA TCAGGTGTTC 
AATTCTCCGG AGACGGGGCA CCCGGGTGAA CCTGGAGCCC GGGGGTGGAC GGAATTTGGT 
GAATTTGACC GATTGGGACA TACGCTGCAA AGCAGGCTTG CTGCCCGCAT CGATGAACAG 
CTTGAGCTTG TCCTGGATCG AATCCAGGGT TTGCTGGAGG CCGGCTGGCA GCAGGTGCGC 
GTAGTAACAG ACCATGGGTG GCTTTTAGTC CCGGGCGGGC TGCCGGCCAT GAAGCTGCCC 
AAATACCTCA CCGAAAGCCG CTGGACACGG TGTGCCGCCA TCCGGCCGGG TGCCCATGTT 
GATGTGCCGA CTGCCGGATG GTACTGGAAT GCATACCAGC ACATCGCTTT TGCTCCGGGG 
GTATATTGTT TCATAAACGG CAACGAATAT GCCCATGGCG GCGTCAGCCT TCAGGAATGC 
CTGCTTCCTG ACTTGACTTT TAATTCCAGC GGGCTAACCC CAGTTACGGT TAGCATAAGG 
GAAATTCAAT GGTATGGGAT GCGCTGTCGC GTTGCAGTTG ATACGAGCAG CAGCGAAGTC 
ATGGCCGACC TGCGGACCAA ACCCAATGAT CCCCATTCCA GTATTACCAC GCCCAAACCG 
ATTGATTCCG GTGGACGTGT TGGCCTTCTT GTCGCGGACG ATGCCCTTGA AGGCACTACG 
GTCAGCCTCG TCCTGCTCGA CCCGTCGGGA CGGGTACTGG CAAAGCAGGC GACTACCGTT 
GGAGGTGATG AGTAG

Protein sequence

MSSRTSEMLA NTLLEAVRDS LLRAGRYDSA TIVPPAAILW TDADGQWQPL VSQLRPLMPE 
LLTLGDYNPE EKTGPAIWLR CVIERMLPDV ELPDKAIPII YLPNVSRQVL RAGEECPESL 
KPLVELQYRG TVWTQRNGKD WTVEAFLVSE DGLGLDVAKD KQTRQAMLRA LPQLATAPVA 
RLRGKRLEAE DFDRLMVADT QRDLLSWLSD PARTREKWGE EKWMAFCSRC KVEYEIDPDR 
DGEIAVAEKM GLQDNEAWQG LWRRYAEAPA LYPGIPAILR RAKPSRLFVN REPWPDENEA 
EEEALRQSLL ELEKLSSPDA RQKIEELEKE HGERREWIWA QLGQSPLAGA LKHLVTLARK 
TARGLGGDMP QAMAELYIEG GYLADDAVLQ ATGSVKSLED AQAIQAAVRS IYLPWLEDVA 
RHFQDLIKTF PLPNADDKDR TLIAANPGQC LLFIDGLRFD IARRLVAMAE ARQLRVNINW 
RWAGLPTVTA TAKPAASPIA GKLSGHLPGE YFIPEIAGAN LPLTPDRFRK LLAEAGYQVF 
NSPETGHPGE PGARGWTEFG EFDRLGHTLQ SRLAARIDEQ LELVLDRIQG LLEAGWQQVR 
VVTDHGWLLV PGGLPAMKLP KYLTESRWTR CAAIRPGAHV DVPTAGWYWN AYQHIAFAPG 
VYCFINGNEY AHGGVSLQEC LLPDLTFNSS GLTPVTVSIR EIQWYGMRCR VAVDTSSSEV 
MADLRTKPND PHSSITTPKP IDSGGRVGLL VADDALEGTT VSLVLLDPSG RVLAKQATTV 
GGDE