Gene Cagg_2066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_2066
Symbol
ID	7269225
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	-
Start bp	2528312
End bp	2529835
Gene Length	1524 bp
Protein Length	507 aa
Translation table	11
GC content	54%
IMG OID	643566901
Product	protein serine phosphatase with GAF(s) sensor(s)
Protein accession	YP_002463390
Protein GI	219848957
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGCTCT CTCTACTCAG CCTGCAATAC GATCGCATTC AAGCACTTGC CGAGGCGTGG 
TTAGCACATG GTGCGCAGGC GTTTGGCGTT TATGCGAATG GCAGGGCATT AGCGTATTGG 
CCGGCAGGGC AGCGGCTCTT GGCGCCCGAC ATCACGGCCC CCATTTACCA ATACGGCGAG 
GTCGCCGGTG AGTTGCGGTT GACCGGTTTG CGCGATGAAG CTGCGCGTCG CCGGTTGCAA 
GCTGAAGCGA ATCTGATCGG CTATATCTTG CAGCTTGAGT ACGAATTGCA ATGTATGACA 
GCCGATCTCG TCGCCAGTCA AGATCAACAG TTGGCGCTCT ACCGGCTCAC TCAAGCCATG 
CGTGATTTGG TGACAATCCG GGAGACGCTC GATACGGTCA TTGTTGAAGC GAAGCGGATG 
GTAAAAGCAC AGGCCGGGTT TGCAACGTAT GTTCCGACCA ATGGCGGCGA ACCGTTGCTC 
GTACAGTCAT CGGAGCAACG CTTGAGTCCG GAGAGTATTT GGCGGTTATA TTGGCAACTA 
CAAACCGAAG ATCGCCCCAT CGTACTGAAT GAAAGTGATG GTGATCTGCG ACGGCCACCC 
GGTGTGCGCA ATCTCTTACT CCTTCCGATC CGGGTACGCG GTATGATCAT GGCGAGCATC 
GGCCTGATCG ATCGGAGTGG TGACTTTGGA ACACCGGAAT TGAAGTTGGG ACGGGCGATT 
GCCGAGCAAG CCAGTGCTCA AATTGAGCGG ATCTTGCTCT ATCAGGAAAT GATCGAGCAA 
GCGCGGCTGC GGAGCGAGAT GGATCTGGCC CGTCGGGTGC AGACCGATCT CTTACCACGG 
ACGTTGCCCG ACGTACCCGG TCTTGACCTG TACGCCTATT CACGACCGGC GCTTCAGGTC 
GGTGGTGATT TCTTCGATTT CATAACCGCT CCCAATCACC CGTTCATTTT CACGATTGGT 
GACGTTAGTG GAAAAGGGGT TTCGGCGGCG CTGTTGATGT CAATGACGCG CACTGCGTTA 
CACAGTAAAG CGCAGTTTAT GCCTTCGCCG ACACCGGCGT CGGTGATGCG ACAGTCGAAC 
AAGGACCTCT ACAACGATTT TACCCGGATT GGTGTTTTTG CTACCGTTTT TGTTGGACAA 
TACGAAGCCG AACGCCGAGA GATTGCATAC GCTAACGCTG GCCACGCTCC GGTTATTTAC 
CGTCCGCGCA GTGGTAACGC CGAACTATTG TTGGCCGACA ACACTGCGAT AGGCATTTTG 
CCGGTAAATC ATTTTCAAAA TCGTTATCTG CCGCTCAGGC CGGGTGATCT GCTTGTAGTT 
GCGACCGACG GCTTTAGTGA TGCGCGCAAT GCAGACGATG AAATGTTCGG GATTGAGCGT 
TTATTAATTG CAATTGATGA ATTGGCCGAA CGATCGGCGC GTGAGATTGC CGACGGCCTG 
TTCAGCGCTA TCGATCGGTT TAGTGCCGGT CATCCGCAAG ATGACGATCA GACCCTTATT 
GTTCTCAAAG GAGCGGAGCC GTGA

Protein sequence

MLLSLLSLQY DRIQALAEAW LAHGAQAFGV YANGRALAYW PAGQRLLAPD ITAPIYQYGE 
VAGELRLTGL RDEAARRRLQ AEANLIGYIL QLEYELQCMT ADLVASQDQQ LALYRLTQAM 
RDLVTIRETL DTVIVEAKRM VKAQAGFATY VPTNGGEPLL VQSSEQRLSP ESIWRLYWQL 
QTEDRPIVLN ESDGDLRRPP GVRNLLLLPI RVRGMIMASI GLIDRSGDFG TPELKLGRAI 
AEQASAQIER ILLYQEMIEQ ARLRSEMDLA RRVQTDLLPR TLPDVPGLDL YAYSRPALQV 
GGDFFDFITA PNHPFIFTIG DVSGKGVSAA LLMSMTRTAL HSKAQFMPSP TPASVMRQSN 
KDLYNDFTRI GVFATVFVGQ YEAERREIAY ANAGHAPVIY RPRSGNAELL LADNTAIGIL 
PVNHFQNRYL PLRPGDLLVV ATDGFSDARN ADDEMFGIER LLIAIDELAE RSAREIADGL 
FSAIDRFSAG HPQDDDQTLI VLKGAEP