Gene Moth_0427 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0427
Symbol
ID	3830951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	430377
End bp	431627
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	38%
IMG OID	637828362
Product	hypothetical protein
Protein accession	YP_429301
Protein GI	83589292
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	54
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0723207
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGTGA TCACACAAGA AAATTTAGCA TTGGTAGTGA CCAAGGAAGT AGAGCAGGTT 
CGTGTAACAG ATATCCATAC CCATCTTTAT CCACCCAATT TTGGAGATCT ATCATTATAT 
GGAATAGACG AGCTGTTAAC CTATCATTAT CTTGTTGCCG AGTTTTTTAG ATATTCTACC 
ATGGACTATG AAGATTTTTT TAATCTATCC AAAACACAGC AGGCTGAACT AATCTTCCAG 
ACATTATTTT TAGAGCACTC ACCTGTGAGT GAGGCTCAGC GCGGTGTTTT AACGACGTTG 
AAAGAACTGG GGATGGATTT AAATGTAAGG GATTTACGTG TCTTCAGGGA ACAAATCAAC 
TCGATTCCGG CATTTGATTA TGTTGATAGG ATTTTTGCGA TAGCTGGAAT AAAAGAAGTT 
GTTATGACTA ATGATCCCTT TGATCCCAAA GAAAGACAAT TATGGGAAAC GAAAGGCAAT 
AAAGATCCGA GATTTAAAGC TGCCCTAAGA CTTGATGTAC TTTTGAATAA CTATGAAAAA 
AACTATGAGT ACTTAAATCA AATGGGTTTT TTGGTTGATA AGAAGCTGGA TGAGAATACA 
TTAACTGAAA TAAGACGTTT TCTTCGTTAT TGGATTGAAA AAACCAATGC CATCTATTTA 
GCGGTCTCAT TACCACCAGA TTTTATGGTT CCTGAAGATT CCTGCCGCTC GAGAATACTA 
GAAAAATGCG TCCTCCCAAT TTGCAGGGAA TTAAATATTC CCCTGGCTTT AATGATTGGG 
GTGAGGAGAT CAATAAACCC CAGGTTAGGC CTGGCGGCGG ATTCTTTAGG AAAAGCTGAT 
ATAAGGGCAA TCGAATACTT GTGCAGGACT TATCCTGAAA ATAAATTTTT AGTAACCATG 
CTATCTAGGG AAAATCAACA TGAACTTGTA GTAACAGCAA GGAAATTTAG GAATTTAATG 
GTATTTGGTT GCTGGTGGTT TTTAAATAAT CCCATGATAG TTGAAGAGAT TACAAATATG 
CGATTGGAAA ATTTGGGTTT GTCATTTATT CCCCAGCACT CAGATGCTCG CGTCCTGGAA 
CATCTCATCT ATAAATGGGT ACATGCCAGG AAGATAATAG CCGATGTTCT GACTAAAAAG 
TACCTAGATC TTTTAGAAAG CGGTTGGAGA GTAACAGAAG AAGAAATTAA GAGGGATATA 
GAGGATTTGT TTGGCAATAA TTTCTGGAAG TTTGTCGGGC GAAATGTTTA A

Protein sequence

MPVITQENLA LVVTKEVEQV RVTDIHTHLY PPNFGDLSLY GIDELLTYHY LVAEFFRYST 
MDYEDFFNLS KTQQAELIFQ TLFLEHSPVS EAQRGVLTTL KELGMDLNVR DLRVFREQIN 
SIPAFDYVDR IFAIAGIKEV VMTNDPFDPK ERQLWETKGN KDPRFKAALR LDVLLNNYEK 
NYEYLNQMGF LVDKKLDENT LTEIRRFLRY WIEKTNAIYL AVSLPPDFMV PEDSCRSRIL 
EKCVLPICRE LNIPLALMIG VRRSINPRLG LAADSLGKAD IRAIEYLCRT YPENKFLVTM 
LSRENQHELV VTARKFRNLM VFGCWWFLNN PMIVEEITNM RLENLGLSFI PQHSDARVLE 
HLIYKWVHAR KIIADVLTKK YLDLLESGWR VTEEEIKRDI EDLFGNNFWK FVGRNV