Gene Cthe_3208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_3208
Symbol
ID	4809510
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	3800183
End bp	3801253
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	36%
IMG OID	640108642
Product	integrase catalytic subunit
Protein accession	YP_001039596
Protein GI	125975686
COG category	[L] Replication, recombination and repair
COG ID	[COG2826] Transposase and inactivated derivatives, IS30 family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGTAC AATATAAGTC TACCACAACT GAGCATAAGT TTAAACACTT AAGTGTTTAT 
GAAAGAGGGC AGATTGCAGC TCTTTTAAAA GAAGGAAAGA GTCAACGTTA TATTGCTAAT 
AAACTAGGTC GCTCGCCAAG TACAATTAGC CGTGAAATTA AAAGAGGGAC AACAATGCAG 
ATGAGAACTG ATTTATCGAC ATACAAAGTA TATTTTCCTG AAACAGGGCA GGCAGTTTAT 
GAGAAAAATC GTATGAATTG CGGAGCAAAG CGTAAATTGG CTCAAGTTGA AGATTTTCTT 
AAGTTTGCAG AAGATAAGAT ACTACGCGAA AAATGGTCTC CAGATGCAGT TGTTGGTTTA 
TGTAGGAGAG ACCCCAAGTG GCAAAATTCT ACTATTGTAT GTACCAAAAC ACTGTATAAT 
TATATAGACC TGGGACTCAT AAAAGTACGA AATATAGATT TAAATCTTAA ACTACGTTTA 
AAATCTAAAA TAAAAAGGAT ACGTCAAAAC AAACGGGTTG TAGGGAAAAG CATTGATCAA 
AGGCCGGAAG AAGTACAATC ACGTCAAACC TTTGGGCATT GGGAAATTGA TACGGTAACA 
GGCAAAAAGT CTAACGATTC AGTAATTTTA ACCTTAACTG AACGAAAAAC CCGCTACGAG 
TTATTGTTTC TTTTGGACGC AAAAGACAGT AATACTGTTA ACGAGGCACT TTCAGAACTT 
AAGAATTGTT ATGGTAAGGA TGTTTCAAAT GTATTTCGCA CTATAACGGC AGACAATGGT 
TCTGAATTTA GTAGACTATC CGAAATGTTA CAAGGGCTAG GAATTGAAGT TTATTTCACT 
CATCCTTATT CCTCATGGGA GAGAGGAACT AATGAACGTC ATAATGGACT TATTAGGCGT 
TTTATTCCTA AAGGAAAGGC TATAAAAGAT TTTTCTGAAG AAACGATAAA ACGGATACAA 
CAATGGTTAA ACAGCCTTCC ACGAAGGATA TTAGGTTACA AAACACCTGA AGAATGTTTT 
AATGAAGAGA TACATAACCT GGTAAACAAA AATATATCAG CAATAGCCTG A

Protein sequence

MAVQYKSTTT EHKFKHLSVY ERGQIAALLK EGKSQRYIAN KLGRSPSTIS REIKRGTTMQ 
MRTDLSTYKV YFPETGQAVY EKNRMNCGAK RKLAQVEDFL KFAEDKILRE KWSPDAVVGL 
CRRDPKWQNS TIVCTKTLYN YIDLGLIKVR NIDLNLKLRL KSKIKRIRQN KRVVGKSIDQ 
RPEEVQSRQT FGHWEIDTVT GKKSNDSVIL TLTERKTRYE LLFLLDAKDS NTVNEALSEL 
KNCYGKDVSN VFRTITADNG SEFSRLSEML QGLGIEVYFT HPYSSWERGT NERHNGLIRR 
FIPKGKAIKD FSEETIKRIQ QWLNSLPRRI LGYKTPEECF NEEIHNLVNK NISAIA