Gene Cagg_2820 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2820
Symbol
ID	7267526
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	3461894
End bp	3463531
Gene Length	1638 bp
Protein Length	545 aa
Translation table	11
GC content	56%
IMG OID	643567641
Product	GAF sensor signal transduction histidine kinase
Protein accession	YP_002464118
Protein GI	219849685
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.771324
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCGC TTGCAATTAA CCAACGCCAA CTGGAAACGC TGAGTCAGCT CCTGATTGCC 
GGCGGACACC ACGAAGTGCC CGATCTGCTC CAGGCGTCGC TCGACCGCTT GATTGCATTC 
TGGCCGGCCC AAGCCGGTGC CTTGCTTTAT ATCTCTCCCT ACGGTGAGAC GATTAAGGTC 
ACACGTGGTC AGCTCGACGC CGAAACGAAT TCGCTGATCG AACAGGCACG TGAAGGGTTT 
GCCCGGCGTG ATGATAACGG TGAACCCATT GTTGGTTCCT ACTCGATTGA CGATAGTCGC 
GATCTGATCG AGTTGCCATT GCAAAGCGGT GGTCAGGGGG TTGGGCTGCT CCATCTGGTG 
GTGAGTCGCA CCGATCAACA ATCCGGCAAC CAACAGCCAC TCGACGAAGA ACTCCTCGTG 
CTGCTGGTGC GCGCCATCGG TGGCGAAGCC GATAAGATTG CGATGTTGCG GCGTGCCGAG 
CGCGATCTGC GGGAACTGCA TTTACTCTAC GAAATCGGTC AGTTGCTTGC CGTGAACCTC 
GATCTGACCA GCCTGCTCAA CGATATTAAA CTGCGGGCGC CGAAAGTGGT CGGTGCCGAA 
CGATGCTCGA TCTTTATTCT CGATGAAGAG ACCAACGAGC TGGTGCTAGA AATACCCGGT 
GAGCAGCGCC GGTATCGCAT GCCGGCCGAT CGCGGGATCG CCGGCTGGGT CGTGACTCAT 
GGGGTTGGGC AGATTGTCAA CGATGTCGAG CACGATCCGC GCTGGTATGA TGCGATCAGC 
CGCGAAGCCG ACTTTGTGAC CCGTTCCATC GTGTGTGTGC CGATGCGGGT GAAAGATCGG 
ATCATCGGCG CAATGCAGTT GCTCAACAAA ATCGATGGTC AGCCGTTTAA CGAGCAGGAT 
TTACAACTGC TCACTACACT TGCTGCCCAA GCGGCTATTG CCATCGAAAA TGCACGCCTG 
TACCAACGGT TAAAGGAAGA ACGTGACCGG TTACTGCAAA AAGAAGCCGA GGTACGGCAC 
GCAATCGCTC GCGATCTCCA CGATGGCCCG ACTCAGAGCA TTGCCGCAAT TGCGATGAAT 
ATCGAGTTTA TTAAGCGTCT GTTTAAGGCA ATGCCGGAAC GTGTCCCCGC CGAACTCGAT 
ACGCTCGCCG AGTTAGTTCA AAAGACAACC CACGATATTC GTAACTTGCT CTTTGAGTTG 
CGACCGCTTG GCCTCGAAAC ACAAGGTTTG TTAGTAACCC TCCAACAGTA CGTTGAACGT 
TGGCGTGATC CCTCGGGTCA CGATACGAAA CTGCGGCTCG AGGCACCGGC CCACGTGCCA 
CGGCTACCTC CCGAAATTGA AGGCGCCATC TTTATCATTT TGCAGGAAGC TATTAATAAC 
GCCCGCAAGC ACGCGCGCAG CGATTCGATC ACGATTTATT TGTATGTCGA AGAGGACCAT 
CTTGTGGCGA GTGTGCGTGA CCGTGGTTGC GGATTTAACG TCGCTGCAGT GGAGAGTGGC 
TATACCAACC GTGGTAGCCT CGGTCTGCTC AACATGAAAG AGCGTGCCCG CCTCATCGGC 
GCCGATCTCC GCATTCGGAG CGAGATTGGG CAAGGAACGA CGGTAGAGCT GCGGATCCCG 
CTCAATCATA CTCAGTAA

Protein sequence

MPPLAINQRQ LETLSQLLIA GGHHEVPDLL QASLDRLIAF WPAQAGALLY ISPYGETIKV 
TRGQLDAETN SLIEQAREGF ARRDDNGEPI VGSYSIDDSR DLIELPLQSG GQGVGLLHLV 
VSRTDQQSGN QQPLDEELLV LLVRAIGGEA DKIAMLRRAE RDLRELHLLY EIGQLLAVNL 
DLTSLLNDIK LRAPKVVGAE RCSIFILDEE TNELVLEIPG EQRRYRMPAD RGIAGWVVTH 
GVGQIVNDVE HDPRWYDAIS READFVTRSI VCVPMRVKDR IIGAMQLLNK IDGQPFNEQD 
LQLLTTLAAQ AAIAIENARL YQRLKEERDR LLQKEAEVRH AIARDLHDGP TQSIAAIAMN 
IEFIKRLFKA MPERVPAELD TLAELVQKTT HDIRNLLFEL RPLGLETQGL LVTLQQYVER 
WRDPSGHDTK LRLEAPAHVP RLPPEIEGAI FIILQEAINN ARKHARSDSI TIYLYVEEDH 
LVASVRDRGC GFNVAAVESG YTNRGSLGLL NMKERARLIG ADLRIRSEIG QGTTVELRIP 
LNHTQ