Gene Cthe_1070 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1070
Symbol
ID	4811368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1276647
End bp	1278848
Gene Length	2202 bp
Protein Length	733 aa
Translation table	11
GC content	39%
IMG OID	640106492
Product	metal dependent phosphohydrolase
Protein accession	YP_001037495
Protein GI	125973585
COG category	[R] General function prediction only
COG ID	[COG1480] Predicted membrane-associated HD superfamily hydrolase
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.940081
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAAAAG ACAAGGATAG GAGCAATAAC GGCAGTAAAA AAGCATTTTA CAAGAATAAA 
CGCATTCAGA GGCTTTTTAT TGCCGCTGCA GCAATTGTTC TTGCATTTCT CATAGTTTTA 
AACGGTGCAA CTCCGAGAAA ATACAGAGTT ACTTTGGGTG CAATATCGGA ATATGACATC 
ATTTCTCCAA GGGACATAGT AAATACTGTA AAGACTGAGG AAAATGCAAA AAAAGCTGCT 
TCGCAAGTTT CGCCGGTTAT GAGGGATATA CCGAATGCAC CTATAGAAGT AATAAATCTG 
GTTGATAAAC TGTTTTTTCT CATTAATGAT GCCCAAAACA CCTATAAGTC GAAAATTTCT 
TCAATCACCG GCAGCCGCCG CTATGAAGAA CTTGCTTCAA ATGCGCTGAG CGAGACAAAA 
GCGGCGTTTG TGGAGAGTAT CGGCGAGCTT GGCATAAAAC TTGAAGATGC CCAGATTGAC 
TACCTTATAT CAAATGCCGG TGAAGAGGAT ATAAACAGTC TTGAGGTTGT AATTCGAAGT 
AAAGTCAATG ACATAATGAG GAAGGATATA ACCGAGGACA ATCTTGAAGA AAGGAAAAAC 
GAGCTAAAAG ACGCCATTTT TAACAGTGAA ATAAAATATG AACTTAAGAA TGTCGGCCTT 
ACGGTTTCGG ATTTTGTTTT AAAACCCAAC AGGACTATTG ATGAAGAACT TACAAAGGCA 
AGAAGAGATG CTGCTTATAA TGACCCCAGA AATATTGAGA CAATTAAAAA GGGACAAAAG 
ATTTTAAGTG CCGGTGATAT AGTAACTGAG GACAAGCTTC AGGTTTTGGA AGACTTAAAT 
CTTCTTGAAA CAACCAGCAG GTTCGATTTT GCTTTTGCAG GAGGAATACT GGCAATAATA 
CTTTTCTTGT CCCTGCTTCT GATTTTGTAT ATGCATAATT TCTGCAAAAA AGTATATTAC 
AACAGAACCG ATTTGATTTT GCTGTCGGTT GTCATTCTTA TGATACTTTT TATTGCAAGA 
TGGGTTCATG AGTATTCTCC TTTGATTATA CCCATATTCA TAGCAACAAT GCTTATATCC 
ATTTTGCTTG ATTTGAGGCT TGCCATCATG GTCAATGTTG TTCTGACCGT GGCAATATCC 
CTGATGATAA ACAATGATTT CAAGTTTATC TATATGGCCC TTGTAACAGG AACTTTTTCC 
GCCTTTATAG TCTCCAAGGC AAATAAAAGA AACCGGCTTT CTCTGGCGGG AATTATTGTT 
TCCGCAATTA ATGTGCTTTT AGTTGCCGCC ATAAATATTA TGTACAAAAC CGGATGGGAA 
ATTTTGCTTA AAGAATGTGC CCTGGTGTTT GCAAACGGAA TAATGTCAAT GGTAATTACA 
ATTGGACTTT TGCCGTTTCT TGAAAGCACG TTTAACGTAA TTACACCTTT AAGGCTTCTG 
GAGCTTGCCA ATCCCAACCA GCCTCTCTTA AAAAGACTGC TTATGGAGGC ACCGGGAACA 
TATCATCACA GCTTGATGGT TGGAAACCTT GCGGAGGCTG CTACTGAAGC CATTGGCGGA 
AATGCTCTGC TTGCCAGGGT TGGAGCTTAT TTTCACGATA TCGGAAAGCT TAAAAGGCCC 
AATTTCTTTA TGGAGAATCA AATGAGCGGC AATCCCCATG ACGACATGAC CGCAAATTTA 
AGTGCTCTTG TCATCACATC CCATATTCAT GACGGCAATG AAATGGCCAA AAAATATAAA 
ATACCTCTTC CTATAAGAGA CATAATTTTA CAGCATCACG GAACCACTCT TGTGAAATAT 
TTTTATCATA AGGCCAAAAC GACCGAAAAA CTGGAGAATG TCGAAGAGGA AAATTTCAGA 
TACGATGGAG TAAAGCCTAC GACAAAAGAA GCCGCAGTGG TTATGCTGGC AGACTCCGTT 
GAAGCGGCCG TAAGGTCAAT GCCTGACAAG ACCGAAGCCA AAATTGAAGA ACTCATAAGA 
AAAATAATCA AGGACAAGCT GGACGACGGG CAGCTTGACA ACTGCAGTCT TACATTAAAA 
GATCTTGACA GTATAGCAAA AGCGTTTATG AAGGTCTTTA GCGGGGTATT TCATTCCAGA 
GAGGAGTATC CTGATATAAA GAAAAAAGAA GACAGTGTTG AGGATGTCAA CAATGAGAAT 
GAGCAAAAGG ACCAAAACCC GAAGACTGAG TCTCTGGAAT AA

Protein sequence

MTKDKDRSNN GSKKAFYKNK RIQRLFIAAA AIVLAFLIVL NGATPRKYRV TLGAISEYDI 
ISPRDIVNTV KTEENAKKAA SQVSPVMRDI PNAPIEVINL VDKLFFLIND AQNTYKSKIS 
SITGSRRYEE LASNALSETK AAFVESIGEL GIKLEDAQID YLISNAGEED INSLEVVIRS 
KVNDIMRKDI TEDNLEERKN ELKDAIFNSE IKYELKNVGL TVSDFVLKPN RTIDEELTKA 
RRDAAYNDPR NIETIKKGQK ILSAGDIVTE DKLQVLEDLN LLETTSRFDF AFAGGILAII 
LFLSLLLILY MHNFCKKVYY NRTDLILLSV VILMILFIAR WVHEYSPLII PIFIATMLIS 
ILLDLRLAIM VNVVLTVAIS LMINNDFKFI YMALVTGTFS AFIVSKANKR NRLSLAGIIV 
SAINVLLVAA INIMYKTGWE ILLKECALVF ANGIMSMVIT IGLLPFLEST FNVITPLRLL 
ELANPNQPLL KRLLMEAPGT YHHSLMVGNL AEAATEAIGG NALLARVGAY FHDIGKLKRP 
NFFMENQMSG NPHDDMTANL SALVITSHIH DGNEMAKKYK IPLPIRDIIL QHHGTTLVKY 
FYHKAKTTEK LENVEEENFR YDGVKPTTKE AAVVMLADSV EAAVRSMPDK TEAKIEELIR 
KIIKDKLDDG QLDNCSLTLK DLDSIAKAFM KVFSGVFHSR EEYPDIKKKE DSVEDVNNEN 
EQKDQNPKTE SLE