Gene Moth_2440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2440
Symbol	secY
ID	3831670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2556605
End bp	2557867
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	52%
IMG OID	637830359
Product	preprotein translocase subunit SecY
Protein accession	YP_431265
Protein GI	83591256
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0201] Preprotein translocase subunit SecY
TIGRFAM ID	[TIGR00967] preprotein translocase, SecY subunit [TIGR01131] ATP synthase subunit 6 (eukaryotes),also subunit A (prokaryotes)

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTAGACA CCCTGGCCAG CGCCTGGAAA CTGGAAGACC TGCGGAAGAA GATTTTTTTC 
ACTTTGCTCA TGTTTGTAGT CTTTCGCCTG GGTGCCCATG TTCCGGTACC GGGTATCAAC 
AATGCCATTT TAAAGGAATT GATTGGTACC GGGACGATCT TCGGGTTTTT TGACGTAATT 
TCCGGCGGGG CTTTTAAGCG CTTTACCATC TTTGCCATGG GCATTATGCC CTACATCAAT 
GCCTCGATTA TCATGCAGCT CCTGACAGTG GTCATCCCGG CCCTGGAGCG CCTGGCCAAG 
GAGGATATTG AGGGCCGAAA AAAAATCGTC CAGTATACAC GCTACGGGAC AGTTATTTTA 
AGTATACTCC AGGCCCTGGG CATGGGCCTG TACCTGGCTC GCTCCCATGC CTTCCTGCGG 
CCGGGCCTTT ATAACTACCT GGTGGTAGTT ATAATGCTTA CAGCGGGAAC GACTTTTCTT 
ATGTGGATGG GCGAACAGAT TACCGAAAAG GGTATCGGCA ATGGCATCTC CCTGATCATC 
TTTGCCGGTA TAGTATCGCG CCTGCCGGCA GGGGCGGCCA GCCTCTACCA GTACGTTACC 
TCAGGAACGG TCAATATTAT TTCCCTGCTT GTCTTTGCCA TTGTGGCTGT GCTTATTATA 
GCTGCCGTGG TGGCAGTACA GGAAGGGGAA CGCCGGATTG CCGTCCAGTA TGCCAAACGG 
GTGGTGGGCC GGCGTGTCTA TGGTGGCCAG AGCACCCATA TACCCCTGAA AGTCAATCAG 
GCAGGGGTTA TTCCCGTAAT CTTTGCCATG TCCATCCTGC TCTTTCCCAG TACCCTGGCG 
TCCTGGTTTC CCCAGAGCAG TTTGGCCCAG ACAATAGTCC GGTTCTTCGA TCCCCGGTCG 
GCTTTCTATA TGATCCTGTA TGCCCTGTTA ATTATCTTCT TTACCTATTT TTATACGGCT 
GTGACCTTTA ACCCCCAGGA CGTGGCCGAT AATATGAAGA AATATGGTGG TTTTATACCG 
GGCTTAAGAC CAGGGCGTCC TACGGCCGAG TATATTGAAC GGATCCTGGC CCGGGTAACC 
CTGGCCGGGG CTATTTTCCT GGCGTTTATT GCCGTACTGC CCAATCTTCT CATGGCTATC 
ACCGGGATCA ACGTCTATTT CGGCGGCACT TCCCTGCTGA TTGTCGTGGG TGTGGCACTG 
GAAACCATGA AACAACTGGA ATCCCACCTG TTGTTGCGGC ACTACCAGGG CTTTATGAAA 
TAA

Protein sequence

MLDTLASAWK LEDLRKKIFF TLLMFVVFRL GAHVPVPGIN NAILKELIGT GTIFGFFDVI 
SGGAFKRFTI FAMGIMPYIN ASIIMQLLTV VIPALERLAK EDIEGRKKIV QYTRYGTVIL 
SILQALGMGL YLARSHAFLR PGLYNYLVVV IMLTAGTTFL MWMGEQITEK GIGNGISLII 
FAGIVSRLPA GAASLYQYVT SGTVNIISLL VFAIVAVLII AAVVAVQEGE RRIAVQYAKR 
VVGRRVYGGQ STHIPLKVNQ AGVIPVIFAM SILLFPSTLA SWFPQSSLAQ TIVRFFDPRS 
AFYMILYALL IIFFTYFYTA VTFNPQDVAD NMKKYGGFIP GLRPGRPTAE YIERILARVT 
LAGAIFLAFI AVLPNLLMAI TGINVYFGGT SLLIVVGVAL ETMKQLESHL LLRHYQGFMK