Gene Cthe_0320 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0320
Symbol
ID	4808538
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	403152
End bp	404618
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	38%
IMG OID	640105731
Product	hypothetical protein
Protein accession	YP_001036751
Protein GI	125972841
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATTTTA TAACTGATTT AATACTAAAA TTGGATCCGG CCGGACTAAC AAGCGTATTT 
ATTATTTTAG CAGTCTTTGT ATTCTCCCTG ATCATCAATT TGTTTACCCG CGGAAAATAT 
ATTGCAATAT ATAATGATTT GGAGAGAACT TGCAGCGCAA AAAATGAGAA ATTTGAAACC 
GATCTTTTAA ATAAAATAGT TGAAACGTAT AAAAGCGCAT CCGTTGGCAA CTACAATCAT 
GTTAACACCC GGGCGATAAT TGAAAACTGT TTCAACAGGC AATTAAAAAC GTTACTGGTG 
TGCGAAAGAT TTGTAAAGCA TACTGCTTTA ATACTTGTCG CTTTGGGACT TTTGGGCACA 
TTTTTGAGTT TGAGCCTTAA TCCTGTGGTC CAATCCGATG TTCTGTCAAA TTCTTCTTTT 
GCCGATTTTC TTAATGATCT GATGCCCTGG GTGCGAAAAA TTGGTGTTGC TTTTACTGCA 
AGTTTCTTTG GAATGGCATT TGCTGTTTTG TTTGCTTTGG TTAACATAGT TCTAAATGCC 
GAGGATGCCC GCAGGAGATT GACGGCGCGG ATTGAAGAAT ATCTTGACAA TACTGTGTCA 
CGTATAGTTG CAAAGGATAA GGAAACAGAA TACAACATGA TGAACAGAAT ACTCAAAGAA 
ACCTTTGCTG AGTTCGGAAA GAGAATAGAG AAATCTCTCA AACAAACGGC TGACGCTTTT 
GGACAAAAGC TTACCACCGT GGCAATGGAA GTGGATATCA CTTCAAAAAC TTTGGATAAC 
ACGGTGGACA AATTTGACCG GGTACTTCAG AATTTTGCAG AAAACATAAA GGAATTTAAA 
GAATTTAATG ACAACCTTAA AAACAATATT GAAAAAATGG ATGGAAACTT TGAAAAGGTT 
GCACAAGCGC TCAACGATAC TTCAAGTATA CTTAAAGATA CATCAAAAAC AGTTGTTGAC 
AACTATAATT CCGTTGAGAG TTTTTCAAAG AGCATTAGAA GTGTGTCGGA GGAAATAACC 
GGCTACAGCG GAAGAATAGT TCAGGATATC AGCAATATCG CGGAGGAAGT GAAAGTTTCC 
GTCTCATCCA TAAGAGAACT TGGAGAAGCA ATAAGAAACG ACCTGGTTGT AAGAACAGAG 
GAGTTGAAAG ATTATCAGGA AAAATTCAAC ATCCTTACGT CCAGGCTAAG TGAAGAATTG 
AACCTTTTGA GGGAGAAAAC GGCGGAAGCT TTTGAAAGGA GTCTTGATGA GAACAGTCAG 
GTTGTGGCAG AAAAAATTAC CAATTACGTC GATAACGTTA TGAAAGGAGT TATGGAAATT 
ATAAATGAAT TCAAGGAAAA TGAAAAGATT TTTGCAAAGA CGATAGTCAT GCTTCCGGAA 
CAGATTACTG CATACAATGA AACCGCAGCC GCCCAAATGA GCAAACAGCT GGACGAGGTA 
AAAAGGTTGT TTAGGAAATT TGAGTGA

Protein sequence

MHFITDLILK LDPAGLTSVF IILAVFVFSL IINLFTRGKY IAIYNDLERT CSAKNEKFET 
DLLNKIVETY KSASVGNYNH VNTRAIIENC FNRQLKTLLV CERFVKHTAL ILVALGLLGT 
FLSLSLNPVV QSDVLSNSSF ADFLNDLMPW VRKIGVAFTA SFFGMAFAVL FALVNIVLNA 
EDARRRLTAR IEEYLDNTVS RIVAKDKETE YNMMNRILKE TFAEFGKRIE KSLKQTADAF 
GQKLTTVAME VDITSKTLDN TVDKFDRVLQ NFAENIKEFK EFNDNLKNNI EKMDGNFEKV 
AQALNDTSSI LKDTSKTVVD NYNSVESFSK SIRSVSEEIT GYSGRIVQDI SNIAEEVKVS 
VSSIRELGEA IRNDLVVRTE ELKDYQEKFN ILTSRLSEEL NLLREKTAEA FERSLDENSQ 
VVAEKITNYV DNVMKGVMEI INEFKENEKI FAKTIVMLPE QITAYNETAA AQMSKQLDEV 
KRLFRKFE