Gene Cthe_2455 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2455
Symbol
ID	4809835
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2931283
End bp	2932395
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	43%
IMG OID	640107870
Product	phage integrase
Protein accession	YP_001038850
Protein GI	125974940
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCGGCC ATATACGCAA AAGAGGTTCC ACCTACAGCA TAGTAGTTGA CATCGGCCGT 
GACGAAAACG GCAAACGCAA ACAAAAGTGG TTTAGCGGCT ACAAAACAAA AAAGGAAGCC 
GAAAAGGCCC TGGCCGACAT AATCGCAAAA ATAGAGAAGG GTGAATATTT TGAACCAGCA 
AACATGACTG TAGCCGAATA CCTCAATTAC TGGCTGGATA CTTACCCCAA AAACAATGTA 
GCACCGAGCA CTTATAGGCG TTATACCGAA TTTGCCGCCC ATATAAAAAC TCATATAGGC 
GGCATCATGA TGCCGAAGCT AAAGCCAGCC CATATTCAAA GCTTTTACTC ATCCCTGCTG 
GAGAAAAACT TAAGTAAAAG CACCGTCTTA AAAATACACC GCATGCTGCA CCTGGCGTTG 
AAACATGCGG TAAACTGGCA GATTATAATA TCAAACCCCA CCGATGCCGT TACGCCACCC 
CGTCCTGATA AAGTAGAAAT GCGAGTATGG GACGTCGAAA CAGCCAAAAA ATTTTTAGAT 
GACATTGCCG AGACACCGAT TTATATACCA GTATTGTTAG CACTGCAAAC CGGCATGAGG 
GCAGGTGAGA TATGCGGCTT AAAATGGGAG AACATTGACC TTCCACGGGG CTTTTTAATG 
GTCAAATATG CCCTACAGCG CATAAACGGC GTACTTACGC TTAAAGAACC AAAAACAGCT 
AAATCAATGC GTACTATAGC TTTAATGGAT TACACCGTCC AAGCTTTAAA AGAACACAAA 
AGAAAGCAGA ATAAAACTAA GCTATTAATG GGTTCTGCCT ATAATGACCA AGACTTTGTA 
TGCGCTTGGG ACGACGGAAG ACCGTATGAC CCCCATTACC TAGGTCAGAA ATTTACAAAA 
CTGATCAAGC TGCTAGGTTA CCCCAAAATA CGTTTCCACG ACCTGAGGCA CACCCACGCC 
ACTATGCTTT TACAGCAAGG CATAAATCCA AAGATAGTAA GCGAACGTCT TGGCCACAGC 
CAAATTTCCG TTACCCTTGA TACTTACAGC CATGTGTTAC CTAATATTCA AAAAGAAGCT 
GTGTCCAAAA TAGAGGAGTT GTTTGCAAAA TAG

Protein sequence

MRGHIRKRGS TYSIVVDIGR DENGKRKQKW FSGYKTKKEA EKALADIIAK IEKGEYFEPA 
NMTVAEYLNY WLDTYPKNNV APSTYRRYTE FAAHIKTHIG GIMMPKLKPA HIQSFYSSLL 
EKNLSKSTVL KIHRMLHLAL KHAVNWQIII SNPTDAVTPP RPDKVEMRVW DVETAKKFLD 
DIAETPIYIP VLLALQTGMR AGEICGLKWE NIDLPRGFLM VKYALQRING VLTLKEPKTA 
KSMRTIALMD YTVQALKEHK RKQNKTKLLM GSAYNDQDFV CAWDDGRPYD PHYLGQKFTK 
LIKLLGYPKI RFHDLRHTHA TMLLQQGINP KIVSERLGHS QISVTLDTYS HVLPNIQKEA 
VSKIEELFAK