Gene Cagg_1345 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1345
Symbol
ID	7268637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	1665944
End bp	1666960
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	60%
IMG OID	643566188
Product	histidine kinase
Protein accession	YP_002462688
Protein GI	219848255
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000383255
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGAGCCAG CCGCCCTACT CGAGCGTGCT ACCGCCATTG TTACCACCCA ACTTGCCGGA 
TTACGCGAAC TCTATCAAGC CGCTCTGCGC CAACAAGAGG GCATCACTCA GCGTGTGCGT 
CAATTATCAC ACCAACTTGA CGAAGCTGTT ATTCAAGAAC AATTTGCCCG CGAACACGGT 
CTCTCAACCG TCACGGCGGC TGCCCGCGTG AAGCAATTAC GTGCCGAACA CGCCGCTGCC 
GTCGAGGCCG AAGCCGAACT GCGTCGCTCG TTACGTCAGC TCGATCAGCT CATTCGCCAG 
ATCGAGATGA GCAGCACCAC ACTTACGCAC AACGCTGAAG GCATCGCCGC CGATCCTTGG 
GTCCAAGCCC TCCGCGCGCA GGTGATCAAA GGCCGCGAGG AAGAGCGCAT CCGGTTGGCG 
CGTGAAGTGC ATGATGGACC GGCACAAGTG CTGGCCAATG CGCTGATGGG TGTTGAAGTC 
TGTCAAAACT TGCTCAAAGA GCAGAACTTC GAGCGCCTCG GCTCGATCCT GAGCCAGTTG 
GGTGATAGCG TGCGTGAAGG CTTGCGCGAC GTGCGCAGCT TCATCGCCGA CCTCCGTCCG 
GGCAAGCTCG AAGAACAGGG CCTTGTACCC GCCCTCCATG ACTACATTCG TCGTTACCGC 
GACACGGTGA GCAGTCCAGT GGTGTTTGAA GCCGATCCGT TGCCGCGCTT GCCGGCTGAA 
GCTGAGATCG TGCTCTACCG CATTGTGCAA GAGGCATTGC AGAACGCACG CAAACATGCC 
CGCGGCGCAC CGGTTCATAT TACCCTGGCA AAACGTGGAG GGCGGTTGTA TCTCGCGATC 
CGCGATGAAG GGCCGGGATT TGATCTGCGC GAAGTCGTGC GGCGCGCCGG GCGCGAAAGC 
TGGGGACTAA CCAGTATGCG CGAACGAGCT GAGTTGATCG GGGCCGAGCT GACAGTCACC 
ACCCGACGCG GCGCCGGCAC CGAGGTCCTC GTGACAATGC CATTGCCGGC GGGATAA

Protein sequence

MEPAALLERA TAIVTTQLAG LRELYQAALR QQEGITQRVR QLSHQLDEAV IQEQFAREHG 
LSTVTAAARV KQLRAEHAAA VEAEAELRRS LRQLDQLIRQ IEMSSTTLTH NAEGIAADPW 
VQALRAQVIK GREEERIRLA REVHDGPAQV LANALMGVEV CQNLLKEQNF ERLGSILSQL 
GDSVREGLRD VRSFIADLRP GKLEEQGLVP ALHDYIRRYR DTVSSPVVFE ADPLPRLPAE 
AEIVLYRIVQ EALQNARKHA RGAPVHITLA KRGGRLYLAI RDEGPGFDLR EVVRRAGRES 
WGLTSMRERA ELIGAELTVT TRRGAGTEVL VTMPLPAG