Gene Cthe_2778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2778
Symbol
ID	4810095
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3279702
End bp	3280724
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	39%
IMG OID	640108198
Product	cytidyltransferase-like protein
Protein accession	YP_001039170
Protein GI	125975260
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG3172] Predicted ATPase/kinase involved in NAD metabolism
TIGRFAM ID	[TIGR00125] cytidyltransferase-related domain [TIGR01526] nicotinamide-nucleotide adenylyltransferase, NadR type

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATAATG TTGGGATATA TGGAGGGTCT TTCAATCCTC TGCATTTGGG GCATATCAGA 
TGTATAATTG AAGCTGCGAA TCAATGCAAG GAACTGCACA TTATTATAAG CTGCGGCGTA 
AATCGTAACG AGATACCGCC AAGGGTACGA TACCGTTGGA TTTACCAAGT GACAAAGCAT 
ATTGGCAATG TAAAAATACA CTTTCTTGAG GATGACGCAG TTGATAAAAA CGCCTATTCC 
AAAGAATATT GGCAAGAAGA TGCGCAAAAG GTAAAAGATA TGGTAGGAAA GCCGATTGAT 
GTGGTTTTCT GCGGAAGTGA CTATGATGAA AACAGCTTTT GGAAGCAATG TTATCCGGAA 
AGTGAGCTTT ATATCATAAA ACGAAACGGA ATCAGTTCTA CAGAGATAAG AAAGAATCCT 
TATGCCCATT GGGACAGCAT ACCGAATGTA GTGAGAGAAT ACTATGTCAA AAAAGTATTG 
CTGATCGGTG GTGAAAGTAC GGGAAAATCA ACGCTTACCA TAAATTTGGC AAATTATTAC 
AATACAAATT ATGTGGAAGA AGTTGGTAGA GAAATTTCCA TGCGTTCCGG AACGGATATG 
CTTATGATAC CCAGTGATTT TACCGATATT TTGCTGACTC ATAAAATGAA AGAATTGGAG 
GCTGCTAAAC AAAGCAACAA AGTATTATTC ATTGATACCG ATTGTTTGAT TACAAGATTT 
TATATTGATT TTCTGGATGA CCCGCAAAAT GATAAAGAGA GGAATAAGGC CCTGGCCGAT 
GCAATTTCAG CTTTAAACCA TTATGATTTG GTGTTTTATT TGGAGCCCGA CGTGGAATTT 
GTGCAGGATG GGGACAGAAG CGAAGTAATA GCGGCTAACA GGGAAAAGTA CGGAAATCAA 
ATAAAGAAAT TGTTTGATGA GCGGGGAATA AAGTATATCA GTGTCAGCGG AAATTACCAT 
GAACGTTTTC TTCGCGTGAC GTCGGAGGTC GACAGGATGC TTGGTATCAA CAGGGCGGAA 
TAA

Protein sequence

MYNVGIYGGS FNPLHLGHIR CIIEAANQCK ELHIIISCGV NRNEIPPRVR YRWIYQVTKH 
IGNVKIHFLE DDAVDKNAYS KEYWQEDAQK VKDMVGKPID VVFCGSDYDE NSFWKQCYPE 
SELYIIKRNG ISSTEIRKNP YAHWDSIPNV VREYYVKKVL LIGGESTGKS TLTINLANYY 
NTNYVEEVGR EISMRSGTDM LMIPSDFTDI LLTHKMKELE AAKQSNKVLF IDTDCLITRF 
YIDFLDDPQN DKERNKALAD AISALNHYDL VFYLEPDVEF VQDGDRSEVI AANREKYGNQ 
IKKLFDERGI KYISVSGNYH ERFLRVTSEV DRMLGINRAE