Gene Moth_0324 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0324
Symbol
ID	3831568
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	328684
End bp	330021
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	53%
IMG OID	637828259
Product	type II secretion system protein E
Protein accession	YP_429201
Protein GI	83589192
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0186517
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCAAAA TCGCTTTAGA ATTTCAATCC CATGACTGGA AGGCCGAGAT TGAGCGCCAG 
CGCATGAAGA TCATCGACGA GCTGGCAGCC CAAATATCGC GGGAGCATCC CGAGATATTT 
TCTGACCAGC TAGTAGACGA GGGGTATGCT GCGGCGGAAA AGATTGTAAA AAATTATGTC 
CTGACCCGCA AGGATTTGGC TCCCAGCGAA GTTGAAGGGG TAGTAAAAGC GATTATGGGT 
CAGGCTACAA GCTACGGGCC GTTGCAGGAA TTTTTTGTGG GCAAAGAAGC CAAAGAGATA 
ACGGAGGTGA TGGTTAACCC TTCAAAGGAC GGTCCCAGAG TGTTCTATGG TAAGCATGGG 
AAATTGCACG ACGCGGGAAG GGGGTATTTT AAAGACAACG ACGAGGTGAC CCGCTACTGC 
CAGAAGATAT GCGAAGACGT GGGCAGGCCC TTCACCGAAG ACGCCCCTAT AGTTGACGCC 
TGGCTGAAGG ACGGCAGCCG GGTGGCGGTG ATGGGTTACA AGGTAAGCCC ATTGGGTACG 
GCCCTGACTA TAAGGAAGTC TCCCTTGCTG CGGCCGCCGA TGCCCCTGGA AAAGCTGGTA 
GAGTATAAGA TGCTGCCCTC GCTGGCGGCT TCCATGATGG TTGATCTTTT GGTAAAGGGG 
CACGCCAATA TAGGCATCTT CGGGAGGACA GACAGCGGTA AAACCACCTT TGCCCGGTCC 
TTAGCCCAGC ATATTGACCC GCAGGAGAGG GTGTTTATCG CTGAAACAAG TTTTGAGATG 
TACCTGCCCA ACCTGCCCAA TTGCATCAAT CTGGTAGAGC TGGTTTACGG CGATAAGACG 
ATAGTGGATA TGACCCAGCT ATGTAAGACC ATGAACAGGA ATAACCCCGA CCGGAGCATA 
GTGGGCGAGA TCAGGAGCAG GGAGATAATC GCCGCCTCCC AGATAGCTTC TTCGACATCC 
GGGGGGTTCT GGACAACGGG CCACGCCGGC GATGTCAACG ACCTGCGGAC GCGGTTATTC 
GGTATGTTCC TGGATGGCGG TGTCCAGCTG CCGGTAGAAT TTCTTGATGA AATCATCAGG 
TCTATGTTTC ACTTCCTGGT TTTCTTAGAT AAAAGTTTTG ACGGCATGAG GACTTTAATG 
TCGCTTGTGG AGGTGACGCC GGAAGGCTAT CGGACGATCA TCAGGTACGA TACGAAAGCT 
TTTGCTGCTT CACGCGGCAA AGAGCGGCGC TGGATTTACG AGAATACTGT TACGCCTGAA 
AAGATGGGCA AGCTGGCGTT CAGCGGGGCG GAATTGAAGC CAGAATACGA AAAGGTGCCG 
GAAAAGTACC TCTGCTGA

Protein sequence

MVKIALEFQS HDWKAEIERQ RMKIIDELAA QISREHPEIF SDQLVDEGYA AAEKIVKNYV 
LTRKDLAPSE VEGVVKAIMG QATSYGPLQE FFVGKEAKEI TEVMVNPSKD GPRVFYGKHG 
KLHDAGRGYF KDNDEVTRYC QKICEDVGRP FTEDAPIVDA WLKDGSRVAV MGYKVSPLGT 
ALTIRKSPLL RPPMPLEKLV EYKMLPSLAA SMMVDLLVKG HANIGIFGRT DSGKTTFARS 
LAQHIDPQER VFIAETSFEM YLPNLPNCIN LVELVYGDKT IVDMTQLCKT MNRNNPDRSI 
VGEIRSREII AASQIASSTS GGFWTTGHAG DVNDLRTRLF GMFLDGGVQL PVEFLDEIIR 
SMFHFLVFLD KSFDGMRTLM SLVEVTPEGY RTIIRYDTKA FAASRGKERR WIYENTVTPE 
KMGKLAFSGA ELKPEYEKVP EKYLC