Gene Cagg_3788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3788
Symbol
ID	7267862
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4621695
End bp	4623212
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	56%
IMG OID	643568596
Product	serine/threonine protein kinase
Protein accession	YP_002465060
Protein GI	219850627
COG category	[K] Transcription [L] Replication, recombination and repair [R] General function prediction only [T] Signal transduction mechanisms
COG ID	[COG0515] Serine/threonine protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.987521
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0424994
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAACCC ACCGCTCGTC TGCTGCTACA AATCAAAGTC TTGGGGCTGA AGTGACCAGC 
ATCCTCTGCC CTATCTGTCT CAAGCCGAAC CTGCGGCGGG CACGGTTTTG CCAGCACTGC 
GGTCACGATG TTGTGCTGAA TAATGACCAG CCCAGTGATC ATCGTCGCTA TGTGATTACG 
CGCATCATTA AGCGCGGTGG TCAGGGTGCT GTCTATGAGG GTATTGATCA AAACGGCAAT 
ATCTACGCGA TTAAAGAGAT GCTCGACCGC TTTACCGACC CAAAAGAACG GGCCGAAGCG 
GTTGAACGAT TTAATGCCGA GGCGGAGTTG CTGCAACAGC TCCGCCATCC GCGTATTCCC 
CGCGTCTACA GCCACTTTAC CGATGAAGGT CGCCACTATT TAACGATGGA CTTTATTCGC 
GGCGAGGATC TCGAACAGAT CGTCGAACGC GAGGGTCGGA TTGATGAGCA GCGGGTACTG 
CGGTGGGCCG ATGAGCTGTG TGATGTGCTT GGGTATCTGC ATGGCAAGGG CTTGATCTAT 
CGCGATATGA AGCCCTCAAA CGTGATGATT GAACCGAGCG GTGATGTCAA GCTGATCGAT 
TTCGGCATTG CTAAGCTCTT CAAACCTACC GAACGTGGTA CGCAGATCGG TACACCGGGC 
TATGCACCGC CTGAGCAGTA TCAGGGGCTG GCGACGCCAC AGTCTGACAT CTACGCATTG 
GCCGCAACGT TACATCATCT GCTGACCGGA CGCGATCCGA CGCAAGAAAT GCCTTTTTCT 
TTTCCACCGG TTCGTTCGCT GGTATCGACT ATTTCGGAAC GGACAAGTGC AGCACTCGAA 
AAGGCGTTGC AGAAGGTACC GGCGGATCGC TATGCGACGA TGGATGAGTT TCGTGCTGCG 
CTCATTCCAC GTGCCCAGCT ACAGCCGCAA CCGGTACAGG TACGTGTCGC ACCGCCGGCT 
TCGGCCAAAG CGCCGGTACC GGCACGACCG GCTGCACCGG TTCCACCGCC GCAACCGGTG 
GCACCCCCTG CCCAATCGGT ACCAGCGGCA TCACCGGTTC CGCCGCAACC GGTGGTGCTC 
CCTGTCCAAC CGGCACAACC GGTTACACGC ACGCGACAAT CGAGTGGGCA AGTTGTCGTT 
TCCCTGATCC TGCTCGCCTT AATTGGGCTG ACCCTCTTGA GTGTCTATGT GATCGCCGTG 
CGGCCACGTT GGGCCGAGCC GTTGATTGCA CCGATCTTGA ATACTACGGA ACAATCCAGT 
TTGCAGCGTG GTGAGCTAAT CACGATCGAG TATGATCTGG AGGTGACGGT ACCGGTGGAC 
GCTGATCAGC AAGCTGTGCG CGCATCGTTT CTGGAAGCCT ATCACGAACA GATACGGCGC 
GAGTATGGGG AGACTGCTCT GATTAACCCC AATGTGCCGA TCGGCTATGT CGTTCCACCA 
GAAGTCATTG ATCAACGGGA TGGTCAAATC ACTTACCGTG CCCGCCTGAC GGGTAGAGTC 
TGGGTACACG AGCCATAA

Protein sequence

MATHRSSAAT NQSLGAEVTS ILCPICLKPN LRRARFCQHC GHDVVLNNDQ PSDHRRYVIT 
RIIKRGGQGA VYEGIDQNGN IYAIKEMLDR FTDPKERAEA VERFNAEAEL LQQLRHPRIP 
RVYSHFTDEG RHYLTMDFIR GEDLEQIVER EGRIDEQRVL RWADELCDVL GYLHGKGLIY 
RDMKPSNVMI EPSGDVKLID FGIAKLFKPT ERGTQIGTPG YAPPEQYQGL ATPQSDIYAL 
AATLHHLLTG RDPTQEMPFS FPPVRSLVST ISERTSAALE KALQKVPADR YATMDEFRAA 
LIPRAQLQPQ PVQVRVAPPA SAKAPVPARP AAPVPPPQPV APPAQSVPAA SPVPPQPVVL 
PVQPAQPVTR TRQSSGQVVV SLILLALIGL TLLSVYVIAV RPRWAEPLIA PILNTTEQSS 
LQRGELITIE YDLEVTVPVD ADQQAVRASF LEAYHEQIRR EYGETALINP NVPIGYVVPP 
EVIDQRDGQI TYRARLTGRV WVHEP