Gene Cagg_2803 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2803
Symbol
ID	7267508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	3441517
End bp	3442785
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	57%
IMG OID	643567624
Product	histidine kinase
Protein accession	YP_002464102
Protein GI	219849669
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.367455
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCCGG TTGAGCAATT GGTGCAACGC TGGCAGCAGA TGATACACTA TTTCGGTAGT 
GGGCAGCGCA CGCTCATGCT GGCCGCGTAT GCGATGATCA GTACTGCGCT GGTCGAGTTT 
ATCCTCTTTC ATCGCCAGTT GCCACCAGAG CGATTTTATG TGGTGATCGT GCTGTTGAGT 
GTCTTGCTCT CCCTCAACGC CGTCTGGGAG CGATTGCAGC AGCGTTGGGG TAACGCAATT 
GCCGATAGAG TCTTTTTTAG TACCAGCTCC ATCATCTTTC TAGCTGCTAA TTATATTGGA 
TTGGACGCCG GTTGGACGTT TTTACCGTTT TTGTTGTTTG TGATTGCATC GCAGGCGATT 
GTGGGGCTGG GTGTTTGGCG TGGGTTAGGT GTCAGTCTGC TCTTGTACCT CGGTTGGTGT 
GGGGTGCTCT GGCTGCGTGG AGTGCCGCTC ATCCAGATTG TTGTCCAGGC CCCGTCGATT 
GCCTTAGGAT TGATCTTTGT CCTGATCTTT TCTATCGTTG CTGCACGGCT CGTTGAACAA 
ACAGCGCGTG CTGAGCGGTT GGCGGCTGAA TTGCAGTCCG TAAACGTGGC ATTGGCAGCA 
GCACGTGAAC GGGAGGTAGA GCTTGCTGCT GCCGAGGAAC GGGTACGGCT GGCGCGCGAG 
ATACACGACG GGTTGGGGCA CCATCTTACG GCGCTGAACG TACAATTGCA AGCCGCTGCG 
CGCTTGCTCA ACCGTGATCC AGAGCGAGCG GCACAGGCAT TGGCGATCTG TCGCGAAGAG 
GCGCAAGCGG CGTTGAATGA GGTGCGACAA AGCGTGGCAG TGATGCGTAA CGCACCGGTA 
AACGGGCGTC CGTTGCCGGA GGTCATCGCG AAACTGGTGG CCGATTTTAA GCGTGTTTCG 
CCGTTGCATG TGCAGTTTGT GGTTGAGGGA GAGATTGGTG AATTGCCGCT GACTGTTGCT 
ATGGCGCTCT ACCGTGCGGT ACAAGAGGGC TTGACCAACG CGCAGAAGCA CGGCCAGGGT 
ACGACGGTGA CGGTACGGCT GATCGGTGAA GTTGGGCAGG TGCGCTTGGA GGTGGTGAAC 
GATGGCCCAC CGGCCCCGCC GGTGGCTGAA ACCGGCTTTG GCCTGGCCGG CTTGCGCGAA 
CGGGCAGCTC GGTTAGGGGG AACGTTGCAC GCTGAACCGC TCCCAGCGGG CGGGTTCCGC 
TTGGCGATGG TTGTGCCACA CGTACAAACA GAGGAGAAGC CGTATGATCC GCATTCTGTT 
GGTCGATGA

Protein sequence

MKPVEQLVQR WQQMIHYFGS GQRTLMLAAY AMISTALVEF ILFHRQLPPE RFYVVIVLLS 
VLLSLNAVWE RLQQRWGNAI ADRVFFSTSS IIFLAANYIG LDAGWTFLPF LLFVIASQAI 
VGLGVWRGLG VSLLLYLGWC GVLWLRGVPL IQIVVQAPSI ALGLIFVLIF SIVAARLVEQ 
TARAERLAAE LQSVNVALAA AREREVELAA AEERVRLARE IHDGLGHHLT ALNVQLQAAA 
RLLNRDPERA AQALAICREE AQAALNEVRQ SVAVMRNAPV NGRPLPEVIA KLVADFKRVS 
PLHVQFVVEG EIGELPLTVA MALYRAVQEG LTNAQKHGQG TTVTVRLIGE VGQVRLEVVN 
DGPPAPPVAE TGFGLAGLRE RAARLGGTLH AEPLPAGGFR LAMVVPHVQT EEKPYDPHSV 
GR