Gene Cthe_2923 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2923
Symbol
ID	4810206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3442610
End bp	3443893
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	41%
IMG OID	640108346
Product	protein translocase subunit secY/sec61 alpha
Protein accession	YP_001039314
Protein GI	125975404
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0201] Preprotein translocase subunit SecY
TIGRFAM ID	[TIGR00967] preprotein translocase, SecY subunit

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000208113
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGTTGT TTACAACTAT AAGAAATGCC TGGAAAATAG CTGATTTGAG AAAAAAGATG 
TTTTTTACAT TACTGATGAT ATTCATATTC AGACTGGGTT CTTTTATACC GGTTCCGGGT 
TTGAATCCTG ATGCATTAAA AAGCATGGTG GATCAAGGAA CAATTTTTGG ATTCTTTAAC 
ATATTATCCG GTGGAGCGTT TGAAAATGCA ACGATCTTTG CCATGAGTAT AACCCCTTAT 
ATCAACGCTT CGATCATAAT ACAGCTTTTA ACAGTGGCAA TCCCCAAACT TGAAGCTCTT 
GCAAAAGAAG GAGAAGAAGG TAGAAAAGCT ATTGCAGAAT ATACGAGATA TGGAGCAGTT 
GTTCTTGGAT TCCTCCAGGC AACAGCATTT TACTTCGGAT TGGCCCAGGC GGTTAATGAA 
AGAAATGTAT TGTCATTTAT TACAATAACT CTTACATTTA CAGCGGGTAC CGCCTTCCTC 
ATGTGGCTGG GCGAACAAAT TACGGAATAT GGAATAGGAA ACGGAATATC CTTGCTTATC 
TTTGCAGGTA TTGTATCAAG AGGACCCAGG GGAATACTTT ATCTGTGGGA TCTGTACAGG 
TTGGAAAGAC TGGGTAAAGG TATCCTTGGA ATTTTTGGAG TACTGGGCGT ATTGCTTCTC 
TTCGTAGTAA TTATTGCTTC AGTTGTATGG GTTGATCAGG CTGAGCGCCG TATACCCGTA 
CAATATGCAA AACGTGTTGT CGGCAGAAAA ATGTATGGCG GGCAGAGCAC TCATATTCCG 
ATTAAGGTTA ATATGGCCGG AGTTTTGCCT ATCATATTTG CCACATCATT TGTTGCACTG 
CCTGCAACAA TAGTGGGATT CTTCTTCCCA AACTCAACTC ATCCTGTAGC CGAGTACTTT 
AGAAGTTTTC AGAGCAGGAT TGAAGTAGCA ATATTGACCG GTCTTTTGAT TATCTTCTTT 
ACGTTTTTCT ATACATTTAT CCAGTTCAAT CCTGTTGAGG TTGCAAACAA TCTTAAGAAA 
AACGGCGGGT TCATACCTGG AATAAGACCG GGGAAACCAA CGTCTGACTA TATTTACAAG 
GTGGTTAGCA GAATAAGTTG GTTTTCAGCC CTGTTCCTCG CCATAATCCA AATATTGCCT 
TCATTATTGC AGGCAATAAC CGGAATCAGA GGAATATGGT TTGCAGGAAC CAGCGTGCTT 
ATCCTTGTCG GCGTTGCCCT CGAAACAGTT AAGCAGATTG AGTCACAGAT GATTATGAGA 
CACTACAGAG GATTTCTGGA GTAA

Protein sequence

MGLFTTIRNA WKIADLRKKM FFTLLMIFIF RLGSFIPVPG LNPDALKSMV DQGTIFGFFN 
ILSGGAFENA TIFAMSITPY INASIIIQLL TVAIPKLEAL AKEGEEGRKA IAEYTRYGAV 
VLGFLQATAF YFGLAQAVNE RNVLSFITIT LTFTAGTAFL MWLGEQITEY GIGNGISLLI 
FAGIVSRGPR GILYLWDLYR LERLGKGILG IFGVLGVLLL FVVIIASVVW VDQAERRIPV 
QYAKRVVGRK MYGGQSTHIP IKVNMAGVLP IIFATSFVAL PATIVGFFFP NSTHPVAEYF 
RSFQSRIEVA ILTGLLIIFF TFFYTFIQFN PVEVANNLKK NGGFIPGIRP GKPTSDYIYK 
VVSRISWFSA LFLAIIQILP SLLQAITGIR GIWFAGTSVL ILVGVALETV KQIESQMIMR 
HYRGFLE