Gene Cthe_3237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_3237
Symbol
ID	4810277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	3841627
End bp	3843018
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	48%
IMG OID	640108671
Product	relaxase/mobilization nuclease domain-containing protein
Protein accession	YP_001039625
Protein GI	125975715
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGATTA TCTATGCAGT CCGGGAACGG ACACAGAGCA AGACCGCCAT GCGCAAGGTA 
ATGGACTATG TGGTCCAGGA CAAAAAGACT ATGTATGAAA ATGAGAACGG TCAAAGGTGC 
AAGCTGGTGT CAGGGCAGAA CTGCTGCGGA GATACCGCTT TCAAAGAATT CATGACCACA 
AAACGGCAGT ATCAAAAGGA AAAAGGCGTG TACTTTTATC AGTATATCCA GTCCTTCAAA 
CCTGGAATAC ACGCCACACC GCAGGAAATT CATCAGATGG GCGTGGAGCT TGCAAAGTAT 
TTCAAAGGCT ATGAAGTGCA AATCGCGACC CACATTGACC GTGATCACTG GCACAACCAC 
CTTATAGTCA ATTCAGTAAG CTGTGAAACG GGCTTGAAAT TACAGTTTAA TGAAAAGAAT 
TTAGAGCAGC TTCGCACCCT GTCGGATGAA ATTTGTGCGG TGCACGGGCT GGATACCTTA 
AAGCCCTATC AGAAGCCAAA GCAAAAGCCC ATGGGTGCAG GTGAGTACCG TGCAGCGGTA 
AGAGGAGGCA GCTATAAATT CAAGCTGATG AACGCCATCG ACCAGGCCAT GACACAGAGC 
CGCACCCGGG AAGAATTTAT CGTCCGTATG GAGCAAATGG GCTACCAGGT GAAATGGAAC 
CCGCACCATA AATATATCAC CTACACCACC CCGGAGGGGC AGCGGTGCAG GGACAATAAG 
CTCCACGAAA CCAAGTATCT AAAAACTGAA ATGGAGGGAT ATTTCAGTGC CAAGCTTAGA 
AGAATTGAAG CAGCGCAACA AGCCGGATAT ACCGGAGGGC ATCCCACCGG TACAACACCA 
GCAGACCGTA GCAGTGCCCT ATCTGCCGCT GGTCAGCGCA ATACCCACCG ACCAATGGAA 
CATGATGCTG GAGAGCCAGA CCGCAGCCAT ACAGCGGTTG CAGGAATTGA CGGTATACAT 
ATCCACCCTG CCAACCGTAG ACGACGTAAA CAATATGATG AAGAATTACT TCCAGAACGT 
TTACGACAGG CAGACGGATC ACCTGTCGAA TACCATACGG AAAGAGCATC AGCGGATTAT 
GGAGAATATG ACTTCGAGTA TGGAGAAGAC GACGGATACG ATTGGATGGA AGCTGACGAA 
TACACTGGAG CATTGGGAAG AAAAGCTCCG GCACCGGGAC ATGTCGCCCA TAAAAATGAA 
AGCCAAATGG GCAGGCATCG GGGCATTGAC TTCGACGATA TTGTGGCTCT TGCTAAAGCT 
GTTGACGACC TTGTAAATCC TTACAACCCC GAGGAAGAAC GGGAAAAGAA AAAGAAATAC 
GTACCCAAAA GCGACCACAA AAAGCAGAAA AAGAAACAAC ACCATAACCA TGACTATGAG 
TTAAGCCTGT AA

Protein sequence

MAIIYAVRER TQSKTAMRKV MDYVVQDKKT MYENENGQRC KLVSGQNCCG DTAFKEFMTT 
KRQYQKEKGV YFYQYIQSFK PGIHATPQEI HQMGVELAKY FKGYEVQIAT HIDRDHWHNH 
LIVNSVSCET GLKLQFNEKN LEQLRTLSDE ICAVHGLDTL KPYQKPKQKP MGAGEYRAAV 
RGGSYKFKLM NAIDQAMTQS RTREEFIVRM EQMGYQVKWN PHHKYITYTT PEGQRCRDNK 
LHETKYLKTE MEGYFSAKLR RIEAAQQAGY TGGHPTGTTP ADRSSALSAA GQRNTHRPME 
HDAGEPDRSH TAVAGIDGIH IHPANRRRRK QYDEELLPER LRQADGSPVE YHTERASADY 
GEYDFEYGED DGYDWMEADE YTGALGRKAP APGHVAHKNE SQMGRHRGID FDDIVALAKA 
VDDLVNPYNP EEEREKKKKY VPKSDHKKQK KKQHHNHDYE LSL