Gene Cthe_1737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1737
Symbol
ID	4810167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2058779
End bp	2060371
Gene Length	1593 bp
Protein Length	530 aa
Translation table	11
GC content	32%
IMG OID	640107150
Product	phage NTP-binding protein
Protein accession	YP_001038151
Protein GI	125974241
COG category
COG ID
TIGRFAM ID	[TIGR01618] phage nucleotide-binding protein

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCAATTTT CCCACAGCAG AGTTGAGTGC TTTGAAAAGT GCAAGTACCA ATTCAAACTG 
CGATATAAAG ACAAAGTAAG GACAATACCT TCACCGGCAG CAGATAATGC TTTAATTGCA 
GGTTCAGCAT TACATCTTGG GATTGAGAAA GGTATAGAGG CAATGGAGCA ATATTATTAT 
AATCAGTATC CAGTTATTAC TGATGCTCAT GTAAATGAAG TTATTAAGCT TACATCATTA 
GTGAAAAAGG CTCAGATTGT AATAAATACA ATGCTTCATA ATAAAGAGCC GACAGAAAAA 
TATGAGTTTA AAATTGATTT TCCAGAATTT ATAGGATTTG TAGACTTTAT TATCCAAACA 
CAGGATGGAA GTCTTAGCAT TTATGATTTT AAATACAGCA ATAATATAGA GCATTATCTG 
GAGTCAAAAC AGCTGCACTT ATATAGGTAT TACTTAGAAA AACTTGGATT TAAGGTATCA 
GAAATAGGAT TTATTTTTAT TCCTAAAACA GCTATAAGGC AAAGGAAAAC TGAGGATTTA 
TATCAGTTTA GAAAAAGGCT TCATAAAACT TTAGAAGCTA TGGAAGTTAA GGTGATTCAA 
ATTCCATATG ATGAGACTAA GGTTCAAGAA TTTAAGCTAA GATGCCGGGA AATTATTAAT 
GAAAAAGAAT ATGAAAAAAC ACCATCAAGA CTTTGTGATT GGTGTGAATA TCAAAATTAT 
TGTGAAGGAG GACAAACAGA TATGTTATTA CCAGAAAATG TTAGGAGAGA ACTTCAAATA 
GACAGGTATC CGGACATGTG GATATATGCC GACAGTTACG TTGGAAAATC AACTTTTGTT 
GATCAGTTCG ATGATTTATT ATTCTTAAAT ACTGATGGAA ACACAGATAA CACAACAAGT 
CCAGTTATAA AAATAGCTGA TGAAGTAACT TTTGAAGGAA GACTTAAAAA AGTCAAAATG 
GCTTGGGAAG TATTTTTAGA TGTTATTACA GAGCTTGAAA AGAAAGATAA CACTTTCAAA 
AGAGTGTGCA TTGATTTAGT TGAGGACTTA TATGAACACT GCAGGCTTTA TATGTATAAC 
AAGTTAGGAA TAGACCATGA GCAGGATGCA GGTTTTGGTA AAGGATGGGA TATGGTTAGA 
ACTGAATATT TATCAGCCAT AAAAAGACTT AAGAATTTAG GATATCAAAT AATTTATATT 
TCTAAGGAAG TAACTACAGA AATAACACTA AAAAATGGAG CTAAGCTTAC AACCATAAAA 
CCTAATATTA ATGAAAAAAT AGCTAATGTT TTAGCAGGAA CAGTAGATTT AACTGTAAGA 
GCCTTTATGG ATGGAGAAGA AAGATACTTG CAGCTTGAAA AGAAAGAAAA TATCTTCGGC 
GGTGGCAGAT TCAATTTTAA AGTTCCAAAA GTAGAGCTTG ATAAGGGTGA GTTTATGAAA 
GCTTTAGAAG ATGCTCAGGA AGGTGTAAAA ACTTATTCTA AATCAGAAAC AGATACTTCT 
GATAATACAG CAGCAGTAGA TAATACAACT GTATTAGAAA CATCTGAAGT TAAAGAAGAA 
TCAGTAAAAA AGAGCAGACG CTCTAGAAAA TAA

Protein sequence

MQFSHSRVEC FEKCKYQFKL RYKDKVRTIP SPAADNALIA GSALHLGIEK GIEAMEQYYY 
NQYPVITDAH VNEVIKLTSL VKKAQIVINT MLHNKEPTEK YEFKIDFPEF IGFVDFIIQT 
QDGSLSIYDF KYSNNIEHYL ESKQLHLYRY YLEKLGFKVS EIGFIFIPKT AIRQRKTEDL 
YQFRKRLHKT LEAMEVKVIQ IPYDETKVQE FKLRCREIIN EKEYEKTPSR LCDWCEYQNY 
CEGGQTDMLL PENVRRELQI DRYPDMWIYA DSYVGKSTFV DQFDDLLFLN TDGNTDNTTS 
PVIKIADEVT FEGRLKKVKM AWEVFLDVIT ELEKKDNTFK RVCIDLVEDL YEHCRLYMYN 
KLGIDHEQDA GFGKGWDMVR TEYLSAIKRL KNLGYQIIYI SKEVTTEITL KNGAKLTTIK 
PNINEKIANV LAGTVDLTVR AFMDGEERYL QLEKKENIFG GGRFNFKVPK VELDKGEFMK 
ALEDAQEGVK TYSKSETDTS DNTAAVDNTT VLETSEVKEE SVKKSRRSRK