Gene Cthe_0273 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0273
Symbol
ID	4808556
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	337173
End bp	338777
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	38%
IMG OID	640105685
Product	metal dependent phosphohydrolase
Protein accession	YP_001036705
Protein GI	125972795
COG category	[T] Signal transduction mechanisms
COG ID	[COG2199] FOG: GGDEF domain [COG2206] HD-GYP domain
TIGRFAM ID	[TIGR00254] diguanylate cyclase (GGDEF) domain [TIGR00277] uncharacterized domain HDIG

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.576727
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATATG ATGAAAAGAG AAGCAAAACT ATAGCCTTTT TTAATAAACA TTTTTTCAAT 
GTTTCATTTG TATTTTTGGT TGGTATATTG GTAATATACA TAATCTATGA AACAGGTCAT 
TTTTTTCCAA CATTCCTGTA TATGAGTGCC TTTGCGGCAA TGATGATTAC GGCAAAGTTT 
TTCATCAGGC ACAAGGCACT AAAACACTTG CTTGCAGTAT TGTCATATGT GCTGTTTATT 
TTTGTTGTGG ATTCGCATTC TTTGCCTTAT CCGTACTATA CCGTAGTCAA CAAATGGAGC 
GTTCTTACCA TTTGCTATGT GCTTCTTCTG GAAAATATAC TGTTTCCTCT CATTGCCGGG 
CTGTATCCTG CACTTAGAAT ATTCATGCTT ATGCCCGAAG CCAAAGCAGG GTTGTATCCC 
ATTGGCAAAG TAATTGGAAC AGCCAACGGC CAAATTTGCT TTACAATTAC ACTTGTCCTC 
ATATACCAGT TATTCGGAAA GGTTATTATT GAACGCAACA AATACAAAAA GATGAGTATT 
ACAGATTCAC TTACAGGTGT GGCAACCTTT GCCCACACAA TTGAAACTGC CAAAAAAATG 
ATCCAAAACG GTAATATTTC AATTCTGATT ACCGATATGG ACCGCTTTAA GCAAATTAAC 
GACACTTTCG GTCACGTGGC GGGAAATAAA GTGCTCATAA AAGTTTCGGA GTTTCTCAAA 
GAAGAAACCG AAGGTCTTGA AAGAATAATC GGAAGGCTTG GTGGCGACGA GTTTATTATT 
GTGGTAAAAA ATGATGGAAA AAACGAAAGA GTAAAAAATT TGGGAGAACA TCTTTCAAAA 
GCAATAAGAG AGAAGAAGTT CGTAATTGAC GAGGAACTGG ATCCGATAAA TCTGTCTTTT 
TCCGTGGGGC AGGCCAATTC GTCGCCTTCC GACACAGAAA ATGACATAGA AAAGCTTTTG 
TATAAAGCAG ATATAAATAT GTATTATAAC AAGTGCAAAA ACCATAGGCT GGACATCTTT 
ACAAATAACA AAAAACCTCT CCTTCCAAAG GAAGGATTTG AACTTTTAAA TGTCCTGGCG 
GAAAAGGATA TGTACACTTA CGTTCATTCC AGGTACACTG CTCAGTACGC TGCTGCGCTT 
GCAAAAGAAG CCGGTCTTCC GGATGAACAG GTTGAACGCA TTTATGCCGC CGGATGGCTC 
CATGACATAG GTAAAATTCT TATATCCAGC GACATAATAA GAAAAAGCAC TACTTTAACT 
CCCGAAGAAT ATGAGCTTAT CAAGGGACAT GTAAATTATG GACTTAACAT AATTAATAAT 
TTATCTCTCC CTGTCGAAAT TATAAATTGC ATAGCATACC ATCACGAAAA CTGGGACGGC 
ACAGGATATC CTCACGGACT CGCAGGAGAA AGCATACCTT TTGAAGCAAG AATTCTGCAA 
TTGGCAGATT CCTATTCCGC AATGATAACA AGAAGAGTAT ACAGAAAAAC TCTAAGTCCT 
GAGGATGCAC TCAATGAAAT TATCTCCGGA TGCGGAAAAC AATTTGATCC CAATCTCGTA 
AAAATATTTG TAAAACTGAT ACAAAGCAAA TTTAAAGCAG CTTAG

Protein sequence

MQYDEKRSKT IAFFNKHFFN VSFVFLVGIL VIYIIYETGH FFPTFLYMSA FAAMMITAKF 
FIRHKALKHL LAVLSYVLFI FVVDSHSLPY PYYTVVNKWS VLTICYVLLL ENILFPLIAG 
LYPALRIFML MPEAKAGLYP IGKVIGTANG QICFTITLVL IYQLFGKVII ERNKYKKMSI 
TDSLTGVATF AHTIETAKKM IQNGNISILI TDMDRFKQIN DTFGHVAGNK VLIKVSEFLK 
EETEGLERII GRLGGDEFII VVKNDGKNER VKNLGEHLSK AIREKKFVID EELDPINLSF 
SVGQANSSPS DTENDIEKLL YKADINMYYN KCKNHRLDIF TNNKKPLLPK EGFELLNVLA 
EKDMYTYVHS RYTAQYAAAL AKEAGLPDEQ VERIYAAGWL HDIGKILISS DIIRKSTTLT 
PEEYELIKGH VNYGLNIINN LSLPVEIINC IAYHHENWDG TGYPHGLAGE SIPFEARILQ 
LADSYSAMIT RRVYRKTLSP EDALNEIISG CGKQFDPNLV KIFVKLIQSK FKAA