Gene Cthe_3041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_3041
Symbol
ID	4811113
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3566571
End bp	3567533
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	37%
IMG OID	640108462
Product	1,4-dihydroxy-2-naphthoate octaprenyltransferase
Protein accession	YP_001039430
Protein GI	125975520
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1575] 1,4-dihydroxy-2-naphthoate octaprenyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000195685
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTTAG GCAGCTTTCT GAAACTGGTT GAGATTAAGA CCAAAATTGC CAGCATGGTA 
CCGTTCATGC TGGGTACGAT ATATGCAATA TACCGTTTTA ATGCTTTTAA CGTTAAAAAT 
TTTTTATTGA TGTTTATATC CCTCTTGTCC TTTGATATGG TGACAACGGC TCTGAACAAC 
TATTTTGATT ATAAAAGAGC GAGAAAAAAA GAGGGATATA ATTATGAACA GCATAATGCA 
ATAGTACGGG ACAAGCTTAC AGAGCCTATG GTAATTACGG TTATACTTGT TCTTTTGGGT 
ATAGCCATAT TATTTGGAGT ATTACTTTAT TTAAATACAA ATATTATTGT ATTGTTGGTG 
GGGGCAATAT CTTTTGCCGT GGGAATTGTT TATTCCTTTG GCCCCCTTCC AATCTCCAGA 
ATGCCCCTGG GGGAAGTGTT TTCGGGATTT TTCATGGGAT TTGTAATAAT ATTTGTTTCC 
GCATTTGTAC ATATTTATGA CCGGAATATC ATCTTGCTGA CTCTTGAAGG GCAATGGCTG 
TCCTTGCGGC TGAATGCCAT GGAGGTGTTG GCTCTTTTTG CCTTTGCTGT CCCTGCGGTA 
TGCGGAATTG CAAACATAAT GCTTGCCAAC AATATATGTG ATGTGGATGA TGACATGGAG 
AACAAGCGGT ACACACTCCC GATATACATT GGAAAGGAAA AGGCGCTGTG GTTGTTTGAA 
ACACTTTATT ATATCGCATT TGTTGATATA ATCATACTTG CTGTTTTCAG GATTGTTTCA 
CCAATAGTGT TATTGACATT GCTTGTATTT ATACCGGTAA GAAGGAATAT AGGACTTTTT 
AGGAAAAAGC AGACCAAGAA GGACACCTTT GAACTTGCTG TCAAAAATTT TGTGGCGATA 
TGTGGTTCGC AATTTATGCT GGTGGGTATT TCCATAATTT TTTCACTTAT AAATTTGTTT 
TAA

Protein sequence

MRLGSFLKLV EIKTKIASMV PFMLGTIYAI YRFNAFNVKN FLLMFISLLS FDMVTTALNN 
YFDYKRARKK EGYNYEQHNA IVRDKLTEPM VITVILVLLG IAILFGVLLY LNTNIIVLLV 
GAISFAVGIV YSFGPLPISR MPLGEVFSGF FMGFVIIFVS AFVHIYDRNI ILLTLEGQWL 
SLRLNAMEVL ALFAFAVPAV CGIANIMLAN NICDVDDDME NKRYTLPIYI GKEKALWLFE 
TLYYIAFVDI IILAVFRIVS PIVLLTLLVF IPVRRNIGLF RKKQTKKDTF ELAVKNFVAI 
CGSQFMLVGI SIIFSLINLF