Gene Cthe_1599 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1599
Symbol
ID	4809590
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1930261
End bp	1931931
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	39%
IMG OID	640107017
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_001038018
Protein GI	125974108
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.928385
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGA GTATTTATAA AAGCATGCTG GTATTGGCCC TTACAACTAT TTTACTTACC 
TCGTTTCTTA TAACCGGAGT GATGTACCGG GCATTCTATC TCAGGATGCA GCAAGAAATC 
AGGAATGAAG CCATTTTTAT ATCATCCGCT TACAATCTAA TCGGACAAGA GTTTTTTTCT 
AGCATTGCAG ATCAAGAAAG CTCTAGCAGG ATTACATGGG TAGCTAGTGA CGGTACTGTT 
TTGTTTGATA ATATGGCTGA TGCAGAAAAG ATGGAAAATC ACCTCAACAG GCCGGAAATT 
GCCGATGCGT TGAAAAACGG ATTTGGTGAA GCAGTTCACC TTTCCAAAAC TCTAGGAACT 
CAGACCTTTT ATTGGGCTGT CCGACTTAAT GACGGCACAG TCCTAAGAGT ATCAGCCACG 
ACTAATAGTG TTTTTAAATC TGTTTTAGGT TTTTTTCCGT ATGTCGCTTT AATCACATTG 
ATGGTTATCT TGCTGACCAT GATCATTGCC AACCTGTTGA CGAAAAAAAT CTTTCTTCCT 
TTGAACAATT TAAATTTGGA GGATCCGTTG TCCAATGATG TCTATGACGA ATTGTCTCCA 
TTGCTAATTC GCATGGCTAA ACAAAATGAT CAGATTAAAA GTCAGTTCAA AAAACTGAAA 
GAGCAGAAGG AAGAGTTTAA TGCAATTACG GAGAATATTA GAGAGGGAAT CATAGTTTTA 
AACAACAAAG GCTTGATATT ATTCATAAAC AAAAGTGCCG CAGACATATT CAATGTCAGT 
ACTCAGGATA TAATTAACAA GCATATATTA ACACTTGATC GAAGCATAAC TCTTCAAAAG 
GCAATAGAGA CAGCTATGGG AGGGCATTTA TTTGAGGATA TATTTGCCAT AGGTGAAAAT 
TCTTTTAATT TACTGGCTAG CCCTGTTAAG GATGAAGTGG TTGTCAAAGG AGTTATTCTG 
TTTATATTGG ATGTAACAGA AAAACAATCC GCCGAAAAAA TGCGCCGTGA GTTTGCCGCT 
AATGTGTCGC ATGAACTTAA AACGCCTCTC ACCTCTATTT TAGGTTACGC AGAGCTTATG 
AAAAGCGGCA TGGTAAAACC TGAAGACATT TCCGAGTTTT CCGACCGCAT ATACAACGAA 
GCAAGGCATC TCATAGACTT GATAGAAGAT GTGATACGGA TCTCCAGACT GGATGAAAAA 
AATGTTCAGC TCCCCTTTGA AGAGATTGAT TTATTGGAAT TGGCAAAAGA AACAGTCGGC 
AGATTATCTT CCCTTGCACA GCAGAAACGG ATAAAGCTAT CAGTCGGCGG TGATAACGCG 
ATCATTTTTG GTGTTAGACA AATTCTGGAG GAGATGATCT ATAATCTTTG TGATAACGCA 
ATCAAATACA ATTATGAAAA CGGCAAGGTT GATGTAAATG TAAAAACTTT CTCCGACCAG 
GTTGTACTAA CCGTAGCCGA TAATGGCTTT GGCATTCCGA GGGAGCATCA AAGCCGCGTG 
TTTGAACGCT TTTATAGAAT CGACAAGTCC CATTCAAGGG AAACCGGTGG AACTGGTCTG 
GGCCTTTCTA TTGTAAAGCA CAGTGCCGAA TTCCATAATG CAAAGATTCG ATTGATGAGC 
AAGCCTGGAA AGGGTACAAC GATTACAGTT ATATTTAGTC GTGAACAATA G

Protein sequence

MKKSIYKSML VLALTTILLT SFLITGVMYR AFYLRMQQEI RNEAIFISSA YNLIGQEFFS 
SIADQESSSR ITWVASDGTV LFDNMADAEK MENHLNRPEI ADALKNGFGE AVHLSKTLGT 
QTFYWAVRLN DGTVLRVSAT TNSVFKSVLG FFPYVALITL MVILLTMIIA NLLTKKIFLP 
LNNLNLEDPL SNDVYDELSP LLIRMAKQND QIKSQFKKLK EQKEEFNAIT ENIREGIIVL 
NNKGLILFIN KSAADIFNVS TQDIINKHIL TLDRSITLQK AIETAMGGHL FEDIFAIGEN 
SFNLLASPVK DEVVVKGVIL FILDVTEKQS AEKMRREFAA NVSHELKTPL TSILGYAELM 
KSGMVKPEDI SEFSDRIYNE ARHLIDLIED VIRISRLDEK NVQLPFEEID LLELAKETVG 
RLSSLAQQKR IKLSVGGDNA IIFGVRQILE EMIYNLCDNA IKYNYENGKV DVNVKTFSDQ 
VVLTVADNGF GIPREHQSRV FERFYRIDKS HSRETGGTGL GLSIVKHSAE FHNAKIRLMS 
KPGKGTTITV IFSREQ