Gene Cthe_2431 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2431
Symbol
ID	4808147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	2904969
End bp	2905934
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	44%
IMG OID	640107845
Product	electron transport complex, RnfABCDGE type, D subunit
Protein accession	YP_001038826
Protein GI	125974916
COG category	[C] Energy production and conversion
COG ID	[COG4658] Predicted NADH:ubiquinone oxidoreductase, subunit RnfD
TIGRFAM ID	[TIGR01946] electron transport complex, RnfABCDGE type, D subunit

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000125331
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGAAAGAA GTTTTATAGT ATCATCATCG CCTCATATAA GGGACAATAT AAGTACAAGG 
CGGATAATGC TGGATGTGAT TATTGCCCTT ATTCCGGCAT CTTTGGCAGG AGTCTACTTT 
TTCGGTCCCA GAACGCTGCT GGTAATTTTA GTAAGCATTC TGGCCTGCGT GTTGTCAGAA 
TATCTCTCAG GTAAGCTGAT GAAAAGAAGC AACACAATTT CAGATTTGAG TGCGGTGGTT 
ACAGGACTTA TTTTGGCATT AAACCTTCCT CCCACAGTAC CTCTGTGGAT GGTTGTGGTA 
GGAGCGGTTG TGGCAATAGT TGTCATAAAA CAGCTGTTTG GAGGAATGGG ACAAAATTTC 
ATCAATCCGG CATTGGGAGC AAGAGTGTTT TTATTTATAT CCTATGCAAA TCGCATGACC 
AATTGGGTAA TACCGGGTAC TGACGCAGTG TCTTCGGCAA CTCCCCTTGG GTTGCTTAAG 
GCCGAAGATG CCGCACAAGT TGTCCTTCCA TCCTACAAGG ACCTTTTCTT TGGCAACATT 
GGAGGATGTA TAGGTGAAGT TTCTGCAGCC GCCCTTTTGA TAGGTGGAAT ATACCTTGTG 
GCAAGAAAGG TTATAAGCCC GGAAATACCT TTGACATACA TCGGAACCTT GGGATTGTTT 
ACATGGATAT TCGGAGGACC AACACTGTTT AGCGGGGACT TTGTATACCA CATACTTTCA 
GGTGGCCTGT TGCTGGGCGC AATTTATATG GCTACGGATT ACACCACTTC GCCCATGACC 
ACCAAGGGAC GGATAATTAT GGGTATAGGA TGCGGACTTC TTACCGGAAT TATACGTCTG 
TATACCAACT ATCCGGAAGG AGCGTCTTTT GCAATCCTTA TAATGAATGT CATGGTTCCG 
TTGATTGACA GATATACCGT TCCAAAAAGT TTTGGAGGTG GAAAAGCCGT TGAAAGATAT 
AGTTAA

Protein sequence

MERSFIVSSS PHIRDNISTR RIMLDVIIAL IPASLAGVYF FGPRTLLVIL VSILACVLSE 
YLSGKLMKRS NTISDLSAVV TGLILALNLP PTVPLWMVVV GAVVAIVVIK QLFGGMGQNF 
INPALGARVF LFISYANRMT NWVIPGTDAV SSATPLGLLK AEDAAQVVLP SYKDLFFGNI 
GGCIGEVSAA ALLIGGIYLV ARKVISPEIP LTYIGTLGLF TWIFGGPTLF SGDFVYHILS 
GGLLLGAIYM ATDYTTSPMT TKGRIIMGIG CGLLTGIIRL YTNYPEGASF AILIMNVMVP 
LIDRYTVPKS FGGGKAVERY S