Gene Cthe_1025 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1025
Symbol
ID	4811319
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1227211
End bp	1228548
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	37%
IMG OID	640106443
Product	hypothetical protein
Protein accession	YP_001037450
Protein GI	125973540
COG category	[C] Energy production and conversion
COG ID	[COG1625] Fe-S oxidoreductase, related to NifB/MoaA family
TIGRFAM ID	[TIGR03279] putative FeS-containing Cyanobacterial-specific oxidoreductase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0603945
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAGGTT TTGGATTGAA ATACAGGCCT GTACCGATAA AAAGGGTTTT GCCCGGAAGT 
ATTGCACAAG AGTCTGACCT TCAGGAAGGG GACTTGATAT TATCCATTAA CGGCCAAAAA 
ATAAGTGACA TATTTGATTA TAGATTTTTA ATTGCCGACG AGAATCTTGT CCTTGAAGTA 
CAAAAGAAAA ACGGAGAAAT CTGGGAAATA GAGATTGAGA AGGACGAATA TGAGGATTTG 
GGTATTGAGT TTGAAAATCT GATGATTGAT GATACCAAAA GCTGCAGAAA TAAATGCATT 
TTTTGTTTTA TAGACCAGCT GCCCAAAGGA ATGAGAGAGA CTCTTTATTT TAAAGATGAT 
GACTCCAGGC TTTCGTTTTT TATGGGAAAT TATGTTACAC TGACGAATAT GAGTTATGAT 
GATATAGACA GGATAATAAA ATATAAAATG TCTCCCATTA ATGTTTCGGT TCATACGTCA 
AACCCGGAAT TGAGGGTATA TATGTTGAGG AACAAGACGG CGGGAGATGT AATGGACAAA 
ATTAAGAGGC TGATAGAAGG TGGAATAAAG GTTAATGCAC AGATAGTTCT GGTAAGGGGA 
GTAAACGACG GAAAGGAACT CGACAGAACC CTAAAGGACC TTAGTGCACT TTATCCGGGC 
TTAAACAGTA TTTCTGTGGT TCCGGTAGGT ATCACAAAGT ATCGTGAAGG ATTGTACGAG 
TTAAAGCCTT TTGACATGGA ATCATCCAGG GAAGTTATAA AACAGGTTGA AGCCTGGCAG 
ATGGAGCTTC TTTCAAAATA CGGTTCAAGA ATTGTTTTTA TTGCGGATGA GTTTTATATC 
ATGGCAGGGC TTGAAATTCC CGATTATTGT GTTTACGAGG ATTTTCCCCA GATAGAAAAC 
GGTGTAGGCC TTGTCGCGAT GCTTAAAAAA GAATTTGATG ATTACTTTGA AGAACTTGAG 
CTCAAGCTCG AAAATAAAAG GGAAGTTTCC ATAGCAACCG GAGTTTCTTC TTATAAATAT 
ATAAAGGAAA TGATAGATAT TCTTGAAAAT AAATATAAGA ATTTGTATGT TCATGTTTAT 
AAAATAAAGA ATAATTTTTT TGGGGAAAAT GTTACTGTGA CCGGACTTCT TACAGGACAG 
GACATTGAGA GGCAGCTGTC CGGAAAAAAT CTCGGCCGGG AACTTTTGCT TTCCGAATCC 
ATGTTGAAGT CCGGCGAAAG AGTATTTCTT GACGATTATA CTGTTGAAAT GCTCGAAGAT 
AAATTAAAAA CAAAGATAAC AATAGTTAGA AATAATGGAA AAGATTTCAT TGAAAAAGTT 
CTGGGAATAG TTTTATAA

Protein sequence

MGGFGLKYRP VPIKRVLPGS IAQESDLQEG DLILSINGQK ISDIFDYRFL IADENLVLEV 
QKKNGEIWEI EIEKDEYEDL GIEFENLMID DTKSCRNKCI FCFIDQLPKG MRETLYFKDD 
DSRLSFFMGN YVTLTNMSYD DIDRIIKYKM SPINVSVHTS NPELRVYMLR NKTAGDVMDK 
IKRLIEGGIK VNAQIVLVRG VNDGKELDRT LKDLSALYPG LNSISVVPVG ITKYREGLYE 
LKPFDMESSR EVIKQVEAWQ MELLSKYGSR IVFIADEFYI MAGLEIPDYC VYEDFPQIEN 
GVGLVAMLKK EFDDYFEELE LKLENKREVS IATGVSSYKY IKEMIDILEN KYKNLYVHVY 
KIKNNFFGEN VTVTGLLTGQ DIERQLSGKN LGRELLLSES MLKSGERVFL DDYTVEMLED 
KLKTKITIVR NNGKDFIEKV LGIVL