Gene Cthe_1297 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1297
Symbol	cobT
ID	4809549
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1574604
End bp	1575659
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	46%
IMG OID	640106720
Product	nicotinate-nucleotide--dimethylbenzimidazole phosphoribosyltransferase
Protein accession	YP_001037722
Protein GI	125973812
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2038] NaMN:DMB phosphoribosyltransferase
TIGRFAM ID	[TIGR03160] nicotinate-nucleotide--dimethylbenzimidazole phosphoribosyltransferase

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTTTTTC AAACACTGAA ATCCATAGGA GAGCTGTATA AAGAACCCAT GGACATGGTT 
CAAAGGAGGC TCGACAGCCT TTCGAAGCCG TTGGGGAGCC TGGGAAGGCT GGAAGATATC 
ATTAAAAAGC TTGCAGGTAT AACCGGAGAA GTTTTTCCGT GTGTTGATAA AAAAGCGGTT 
ATTATAATGT GTGCGGACAA CGGAGTTGTG GAAGAGGGGA TAAGTTCCTG CCCGAAAGAT 
GTTACTTCCA AAGTGACCAG GAATTTTCTG AAGGGTATAA CAGCCATAAA TGCTTTTGCA 
AAGCATACAG GTTCCGATAT TGTAGTGGTT GATATCGGAG TGGATGATGA CATGGACTGT 
GAAGGAATTG TAAAGCGCAA AGTAAGAAAA GGTACCTGGA ATATTGCAAA AGGGCCCGCA 
ATGACGCGCA AAGAGGCAAT AGAGGCCATA GAGGTCGGAA TTTCCATTGT GGAGGAACTT 
GGCAGGAAAG GAGTAAATCT TTTAGGCACG GGAGAAATGG GTATTGGCAA TACCACGACC 
AGCAGCGCGG TTTCAACGGT TTTGACAGAT TCAAAAGCTG AGAATATGGT GGGCAGGGGA 
GCAGGCCTTT CGGATGAAGC GCTGAAAAGA AAGATTTCGA TTGTCAAAAA GGCTATAGAT 
TTAAACAGAC CCGATGCAAA CGACCCTATT GACGTTGTTT CAAAAGTGGG CGGGTTTGAT 
ATTGCAGGCC TTGCAGGCTG CTTTATCGGT GCAGCGGCAT GTAGAATTCC GATCCTTATT 
GACGGATTTA TATCTGCAAC AGCTGCCCTT GCAGCAGTAA GGATGGAGCC GAAGGTCAAA 
AATTTCATTT TTCCTTCCCA TGGTTCAGCA GAACCCGGAA GCAAAAAAGT TATGGAAGCG 
TTGGGATTTG AACCTATACT GAATCTGGAG ATGAGAGTCG GAGAGGGCAC CGGTGCGGCA 
CTGGCATTTC ATATTTTTGA CTGTGCCGTG TCGGTATACA GGAACATGGG CACATTTGAG 
GATGCATGTA TTGAACAATA TCAGCCTCAG GTGTAA

Protein sequence

MLFQTLKSIG ELYKEPMDMV QRRLDSLSKP LGSLGRLEDI IKKLAGITGE VFPCVDKKAV 
IIMCADNGVV EEGISSCPKD VTSKVTRNFL KGITAINAFA KHTGSDIVVV DIGVDDDMDC 
EGIVKRKVRK GTWNIAKGPA MTRKEAIEAI EVGISIVEEL GRKGVNLLGT GEMGIGNTTT 
SSAVSTVLTD SKAENMVGRG AGLSDEALKR KISIVKKAID LNRPDANDPI DVVSKVGGFD 
IAGLAGCFIG AAACRIPILI DGFISATAAL AAVRMEPKVK NFIFPSHGSA EPGSKKVMEA 
LGFEPILNLE MRVGEGTGAA LAFHIFDCAV SVYRNMGTFE DACIEQYQPQ V