Gene Cthe_1341 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1341
Symbol
ID	4809481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1632612
End bp	1634129
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	40%
IMG OID	640106765
Product	coproporphyrinogen III oxidase
Protein accession	YP_001037766
Protein GI	125973856
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.996503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGTAT ATGTAAAGTT GGAAGGACAT GAGTTTCGAT ATGAGATAGA GAATATATTA 
AAAATGTTCT TTGAAATGGG GAGTACAGAG ATATCATATC AGGACCCCGG AGAGAATTAC 
CGGGGGATTT TGCTGTATTC ACGCCTTGAT ATTCCTTACG GAAGTGACGG GCTGTACCGG 
ACAGAAACCG TAATTTGTGT TGACGGGGAG AATGTATTAA AGGAAAATCA CTTCTTTACG 
GTCTCAGTAC CTGGGGAAGA TTCAAACTCT TTGCTTGAAG AGAGAAAAAT ACAAAAAAGA 
GAGGTTAAAA GAGAGGCATA CAAGGCACTG TCCAAATTTA CAGGGAAAAG TATGCCTTGG 
GGAATGCTTA CCGGGATAAG ACCTGCCAAA ATAGTCCATG AACTTATGGA CAAAGGCTGT 
TCGAAGGAAG AAATAAACTC TACACTGAAA GAATATTATT TTGTCTCTGA TAAAAAGTCA 
GAGATTTTAT ACAACGTTGC CAAAAAAGAA AGGTATATAC TGGATAACAG TGAACAGGAC 
ATGGTGGGAG TTTACATTGG CATTCCTTTC TGCACCACCC GCTGCCTTTA CTGCTCTTTT 
ACTTCCAATC CGATAAAAAA ATATGAGCAT ATGGTGGAAA GCTATATAAA GGCCCTGAAG 
AAGGAAATAA TGAGTGTGGC CGGTATTTTG GAGAAGAAGA AATTAAAAAT AGAGAGCATA 
TATATAGGCG GAGGCACACC TACTTCCATT GAAGCTTTGC ATCTTAAAGA ACTTCTTGGT 
TTTATTGAGC AGGCATTGAA TTTAAAAGAT TTGAAGGAAT ACTCTTTGGA GGCCGGAAGG 
CCTGACTCCA TTACCTGTGA GAAGCTGGAG ATAATAAAAA ACAGCAGGGT GGACAGGATA 
AGTATCAATC CTCAGTCCAT GAATGATGAA ATCTTAAAGA AAATTGGGAG GCTTCATACT 
TCAAAGGATA TAGTCGAGGC TTTTCAACTT GCCAGAAGCA TGGGCTTTGA CAATATAAAC 
ATGGATGTTA TTGCAGGACT TCCGGGAAGC ACTCTTGAGG ACTTTGTAAA AACTATGGAG 
GAAATAATTG TTTTAGGACC TGAGAGTGTT ACTGTTCATA CCATGGCAAT CAAGCGTGCG 
TCACGGCTTA ATGAAGACAG GGAAAACTAC AGCCTGACCT CGGGAAGCGA AGTGTCCAAA 
ATGGTTGATG CGGCTTATGA TATTTTGACC AAAATGGGAC TGGAGCCGTA TTATCTTTAC 
AGGCAGAAAA ACATGCTTGG CAATCTCGAA AACATTGGAT ACAGCAAGGC TGGCTATGAG 
TCGATATACA ATGTCCAGAT TATGGAAGAA AAGCAGTCAA TTATAGCATT GGGGGCGGGG 
GCCGTAACCA AAGTGGTTTT TCCCGAAAGC AACAGGATTG AAAGGGCTTT TAATGTAAAG 
AATGTGGAGG AGTATATAAG CCGGATTGAC GAGATGATTG AGAGGAAAAA TGTTCTTTTA 
TTTTCCAATG AAGAGTAG

Protein sequence

MKVYVKLEGH EFRYEIENIL KMFFEMGSTE ISYQDPGENY RGILLYSRLD IPYGSDGLYR 
TETVICVDGE NVLKENHFFT VSVPGEDSNS LLEERKIQKR EVKREAYKAL SKFTGKSMPW 
GMLTGIRPAK IVHELMDKGC SKEEINSTLK EYYFVSDKKS EILYNVAKKE RYILDNSEQD 
MVGVYIGIPF CTTRCLYCSF TSNPIKKYEH MVESYIKALK KEIMSVAGIL EKKKLKIESI 
YIGGGTPTSI EALHLKELLG FIEQALNLKD LKEYSLEAGR PDSITCEKLE IIKNSRVDRI 
SINPQSMNDE ILKKIGRLHT SKDIVEAFQL ARSMGFDNIN MDVIAGLPGS TLEDFVKTME 
EIIVLGPESV TVHTMAIKRA SRLNEDRENY SLTSGSEVSK MVDAAYDILT KMGLEPYYLY 
RQKNMLGNLE NIGYSKAGYE SIYNVQIMEE KQSIIALGAG AVTKVVFPES NRIERAFNVK 
NVEEYISRID EMIERKNVLL FSNEE