Gene Cagg_1768 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1768
Symbol
ID	7267680
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2161354
End bp	2163354
Gene Length	2001 bp
Protein Length	666 aa
Translation table	11
GC content	56%
IMG OID	643566609
Product	histidine kinase
Protein accession	YP_002463104
Protein GI	219848671
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.686261
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0755696
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACGCT ACCAACGGAC TGCGCTCGCG TTTCTCGGTC TGCTCTCAAT AGTAACCCTG 
ATCGCTGCGC TCAGCACGGT CGGTGATGCA ACGTTGCGCA ACGACTGGCC ACGATTGGCC 
GGGATGTTAG CGTGTCTTGG CGTAATGCTC GGTTTGGCGT GGCTGACACC GCTCCGACTG 
CTGAAGGTTG GCGGGCGATT AACGCTGATC GTCATTGAAT TGGCCGCCGC TGCAGGTGCC 
CAACTACTCA CTGCAGCACC GTTAATCGAC TATATCTATC TCGTACTCGT CCTGCAGGGA 
ATCATCCTCT TCAGGCCATG GTTGTGGGCA TTGATGGCGG TGAGTGTGTG GATCATTTGG 
GCGATTGTAC GCTATCAACT CTCGAACGAT CTATTGATCT GGCTACAAAG CAACCTTGCG 
ATTGCCTTTC CCGCGGTTTG CGCCATTATT GCAGCGTGTA TCTATGCACG CCACGTTCAC 
CGTAGCGAGC AGATGCAGCA GATGCTCCAA CAGATGCAGC AACGCTATAC GTCGCTATCG 
ACATTATTAC GTGATGTACA GCAGCGTGTC GCGCGGGAGG AACGTCAGCG GCTGTTGAAC 
CGGCTCATCA GTGAGGTACA GCAGACATTG GTCTATGCGG AGCAAGGGCT GACTACAGCC 
TTGGCGATGG CTCAATCAAA CCTTAACCGT TTACAAACCG CACTTGATGT ACCACGAACG 
GCAACGGCAA CGGCGATTGC CCGACTACGG GCGACCGTGC AGACGCTCCG CTACGTGCCA 
AATGACCCAA AACCGACACC GTATGGAATG CTGGCCGGGG TGTTTGATGA AGGGCTGATC 
TCGCCGTTGC CCAACAATAT ACTGGCTTGG TTGCTGCCAT CTCTCTTTGT AAGCCTATCT 
TTAGGGCTGG TATTACTCCA ATCCTGGCCG CCCTCGCTAC CGATACTGCG CTGGCTCGTA 
GTACTAGGCG GTCTATTGAT CGTTACCAGT GCCTGCACAC AGTACGTCCG TCGTTCCGTC 
TTCATCCAGC TCGGCCTAGT AGTACAAACA ATTACGATAA CCCTCATGGC CGCCCTCACC 
AACCTGCTTC CCCTGTTGTG GGGGCTGTTG TTGGTCGCCT GGCAGATGAC CAGTCGCCTC 
TCACGGTGGC AACTGCTCCT TTTCAGCGGA ATATGGCTCC TGTTGCTAAC GGTGATCGTC 
ATCATCCAGC CAATCTTTCT CGACCTTACG ACCATCCTCA GCTTATTGGT GGCGATGCTA 
CTCGTCAGTG GCCCATTGTT GTTGGCTCGA CGCCAATTAC GTCGTCGCCA GCAGGTCGCA 
CAGCAGGTTC AGTTGCTTGA AACCGAAATA AAACAGCAAA CCGACGAGGT GCAGCGGATT 
ACCATCGCCG CCGAACGTTT GCGTCTTGCC CGCGAAGTAC ACGACGATCT CGGTTCCAAA 
CTCGTGTTAA TGAATCTTGA ACTGCAACTC GCCACCGAAC TGGCCGGCGA AGATCCGGCT 
AAGGCGCGTG ACCATTTAGC GAACAGTCGC GAATTGTTGC ATAGCGCATG GCGCAGTTTG 
TTGGCAGTGG CCGACGCTGA GTTACCGTTT CAACCGGCAA CGCTAGTCCC AGCGCTACAC 
CGGCTAACCC AACAATGCGC ACAGAGCACC CAGGCTACCG TGACTATCGA CATTGAAGGC 
GATATGGCGC AATTACCGTC ACAGGTAGCG CATTGTATCT ACCGCACGGT GCAAGAGGGG 
TTGACCAACG CCTGCAAACA CGCCCGCGCT GCCACCATGC ATGTCCAGGT GCGTGCAGCC 
GACGGCTACG TGGTAGTTAC CGTCACCAAC GATAACCGTC CACACCAAGT ATTACCCCCT 
GTTGATTTGG GAAATGGCAG TTTTGGTCTA TTAGGTCTGC GTGAACGGGC TGAGGCCCTC 
GGTGGCGGGT TAGAGGCGGG ACCACTCGCC GAGGGTGGCT GGCGACTACG GCTGGTATTA 
CCCTACGAAG GTGAGGAATA G

Protein sequence

MARYQRTALA FLGLLSIVTL IAALSTVGDA TLRNDWPRLA GMLACLGVML GLAWLTPLRL 
LKVGGRLTLI VIELAAAAGA QLLTAAPLID YIYLVLVLQG IILFRPWLWA LMAVSVWIIW 
AIVRYQLSND LLIWLQSNLA IAFPAVCAII AACIYARHVH RSEQMQQMLQ QMQQRYTSLS 
TLLRDVQQRV AREERQRLLN RLISEVQQTL VYAEQGLTTA LAMAQSNLNR LQTALDVPRT 
ATATAIARLR ATVQTLRYVP NDPKPTPYGM LAGVFDEGLI SPLPNNILAW LLPSLFVSLS 
LGLVLLQSWP PSLPILRWLV VLGGLLIVTS ACTQYVRRSV FIQLGLVVQT ITITLMAALT 
NLLPLLWGLL LVAWQMTSRL SRWQLLLFSG IWLLLLTVIV IIQPIFLDLT TILSLLVAML 
LVSGPLLLAR RQLRRRQQVA QQVQLLETEI KQQTDEVQRI TIAAERLRLA REVHDDLGSK 
LVLMNLELQL ATELAGEDPA KARDHLANSR ELLHSAWRSL LAVADAELPF QPATLVPALH 
RLTQQCAQST QATVTIDIEG DMAQLPSQVA HCIYRTVQEG LTNACKHARA ATMHVQVRAA 
DGYVVVTVTN DNRPHQVLPP VDLGNGSFGL LGLRERAEAL GGGLEAGPLA EGGWRLRLVL 
PYEGEE