Gene Cagg_0244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_0244
Symbol
ID	7267424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	305790
End bp	306965
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	55%
IMG OID	643565113
Product	histidine kinase
Protein accession	YP_002461628
Protein GI	219847195
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.300489
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATGGC TACACCAACT CCGCTGGAAG CTGTTCGTTT CCCACCTTAT TATTGTGCTA 
ATGGCGTATG TGGTCCTACT GGTCACTGCA AATGTGTTAG CCAATCTGGG TCTAACCGGT 
TTTGCCCCGT TGACGCTTGG CGCTGCTGCC TCCGAAACGG GTCAGCTCGG TACAGATACG 
GTCAGTACAA CCAATGCGTT GCAAGAACAA TTTCAGTCGG TAGTCCAGCA GTCGCTCTTG 
ATTAGTGGCT TTGCCGCCCT TGCTGCTGCC GTGGTCGTTA GTCTGTTTGT CTCACGGCGG 
ATTGTCGAAC CGATTCAGAC GTTGTCGCAG GTTAGTCGCC GGTTGGCGCA GGGATTTTAC 
CGCGAACGAA CGATCATCTA TGCCGATGAT GAGATTGCAC AATTGGCGCA GAGTGTGAAT 
CAGTTGGCCG ATGCGCTCGA TCAGACCGAG CGTCGCCGGT TGGCACTGCT CGCCGACGTG 
ACGCACGAAT TGCGGACACC GCTCGCAACC ATCGGCGGCT ATATGGAAGG GTTGGTTGAT 
GGGGTAGTGT CGGCAAATCC GGCAACGTTC AACCTGATCT TACGAGAAAC ACGCCGTCTC 
CAACGCTTGA TCGAAGACCT TGAGTTGCTG TCACGGGTTG AAGCCGGACA GTTACCGGTA 
ATTGCGCGCG CCATCGATCT ACGACCGGTG ATCGAGGAGC AGATTGCTCA GTTTGAGCCG 
TTGTTCAGTA GTAATCAGGT GAACCTCATC CTTGATATGC CAGAGCAAGT ACCGCAGGTG 
TGGGCCGATC CCGATCGGGT GGCGCAAGTG TTGATCAATA TTCTGGTCAA CGCTTGTCGC 
TACACCCCAC CAGGTGGTAG TGTCACAGTA CAGGTGCGTG TCGATGACCA CGAAGTACGG 
GTTGCCGTGA TCGATACCGG TATCGGGATC GCTGCCGAGC ATTTACCGCA TGTGTTTGAA 
CGATTTTATC GCGTGGATAA ATCGCGTGCG CGGAATAGTG GTGGGAGCGG GATCGGGTTG 
GCAATCGCCC GTCATCTTAT TTATGCGCAG GGTGGTGAGA TCTGGGCAGA AAGCGATGGT 
CTTGGGAAGG GTGCGCGCTT TATTTTTACC CTGCCAATCG CGCCGCAGAT GGCGACGGTG 
CCGGTTGAGC CTGTGGTCAT ATCAGAAACA GCATGA

Protein sequence

MKWLHQLRWK LFVSHLIIVL MAYVVLLVTA NVLANLGLTG FAPLTLGAAA SETGQLGTDT 
VSTTNALQEQ FQSVVQQSLL ISGFAALAAA VVVSLFVSRR IVEPIQTLSQ VSRRLAQGFY 
RERTIIYADD EIAQLAQSVN QLADALDQTE RRRLALLADV THELRTPLAT IGGYMEGLVD 
GVVSANPATF NLILRETRRL QRLIEDLELL SRVEAGQLPV IARAIDLRPV IEEQIAQFEP 
LFSSNQVNLI LDMPEQVPQV WADPDRVAQV LINILVNACR YTPPGGSVTV QVRVDDHEVR 
VAVIDTGIGI AAEHLPHVFE RFYRVDKSRA RNSGGSGIGL AIARHLIYAQ GGEIWAESDG 
LGKGARFIFT LPIAPQMATV PVEPVVISET A