Gene Cpha266_2687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cpha266_2687
Symbol
ID	4568866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium phaeobacteroides DSM 266
Kingdom	Bacteria
Replicon accession	NC_008639
Strand	-
Start bp	3080957
End bp	3082621
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	51%
IMG OID	639767254
Product	PAS/PAC sensor signal transduction histidine kinase
Protein accession	YP_913095
Protein GI	119358451
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAA ACAGAACAGC AGATGCCGAC GACTTCTCCG AAAAGCGTCT CCAGGCAGAA 
GCGATCCTGC TGCATGAGCG AAAAAAAAAA GTTGATAGCC TTGAATCAGT CGAAGATCGT 
CTTCGCATTA TCCATGAGCT ATCGGTCAAC CAGATTGAGC TTGAAATGCA GCAGGACGAA 
CTGCTGCAGT CGAGAGCAGT TCTCGAAGCG GGGTTAAAGA GATATAACGA GCTCTACGAT 
TTTGCGCCCC TTGGATACCT GACCATCGCC GCGGACAGCA CAATACGCAA GCTGAACCTG 
ACGGCCGCAA CAATGCTTGG TCTCGATCGC TCTCTTTTGA AAGGCGACCG GTTGGGACGG 
TTTATTGTCT ATGAAGATCT TCCGGTTTTC AATGCCCTCA TAAAGAGAGT CTTCGCCACT 
CGGGAGAGCG GATATTGCGA GGTGATGCTG CTTGACCATG CCAGAGATAA ACAGGAGATC 
GCAACCTCCG GCCCGCGTCA ACGACGCATG GTTCGTATCG ATGCCATAGT TAACAGCGAA 
AAACAGGAGT GCTGGGCCTT TCTGACGGAC ATCACCATTC AAAAACAGCT TGAGGACTCG 
TTATGGGAAA GCGACCGCCT CTATCGATGC CTGATTGAAA CGGTCAGCGA AGGCGTTCTT 
GTTATTCACG GCGACCATTT GCGTTTTGTG AATCCGATCG TATCGGAAAT GACCGGTTAC 
ACTGAAGCGG AGCTGCTCTC CTTTTCGTTT ACCGATATGA TGCATCCTGA TGACAGGGAG 
CGGGTAAAAC ACCACCACCT CAAATGTCTC AAGAGCGACC TGCCCGACCT GAGAATTGAG 
TTACGGATCA TCAAAAAAAA CGGAAGGATC CTCTGGATCG AAATGGGCGG GTTAAAAACC 
GAATGGAACG GCAAGCCCGC AATGCTATAC GTTTTGATAG ACATCACCGA GCGAAAAGTC 
CTTGAGGAGA AGCTGCAAAC CGAAAAGCAG CAGCTTCTTG ATACGCTCAG AACCACCGAT 
CAATACCAGG CTCAACTGCA GGAGCTCAAC AGCAAAATCA AGGTCATGTC GGAAGTCGAG 
GAGCGCTCCC TGCTCTACCG TGACCTGCAC GACGGAGCAG GCCAGTCGCT GCACGCGGTA 
TGTCTGCATC TTAAAATGAT TGCGGATGGT CGCGGAGGAT ATGGAGACCT CAAGTCGCTC 
GCATCTGAAC TTGCTGGTGA AATTGCCGAT ATCTCTGCTG AAATCCGTGA TATTGCCCAT 
CACCTCCGTC CTGCCTATCT TCAGGAAATC ACCCTTGATC GAGCCATTAT CAAGCGCTGC 
GAGATGCTCG GAAGACGAGG GGTTCCAATC AGCATCAGTT GTGTCGGCGA TTTCAGTTCC 
CTCTCCTGTC AGGTCAGCGA AAACCTCTAC CGTATTTCCC AGGAGGCGAT AGCAAATGCC 
GACCGCCACG CGGCGGCAAC CCTGATCACG GTACGCTTAA CCCGTGTTGA TAATGCGTTA 
ACACTGCTCA TAGCCGATAA TGGTTGCGGA ATAAAAGACG TTTCGACAAA TAAAGGTGTT 
GGACTGCGAA TCATAGAGGA ACGGGTTTCG CTCATAGGCG GAAAGCTCGA CATGGCATCC 
ACCGCTTCGG GCACCACAAT TACCGTGACG CTGGAGTTGC CATGA

Protein sequence

MKKNRTADAD DFSEKRLQAE AILLHERKKK VDSLESVEDR LRIIHELSVN QIELEMQQDE 
LLQSRAVLEA GLKRYNELYD FAPLGYLTIA ADSTIRKLNL TAATMLGLDR SLLKGDRLGR 
FIVYEDLPVF NALIKRVFAT RESGYCEVML LDHARDKQEI ATSGPRQRRM VRIDAIVNSE 
KQECWAFLTD ITIQKQLEDS LWESDRLYRC LIETVSEGVL VIHGDHLRFV NPIVSEMTGY 
TEAELLSFSF TDMMHPDDRE RVKHHHLKCL KSDLPDLRIE LRIIKKNGRI LWIEMGGLKT 
EWNGKPAMLY VLIDITERKV LEEKLQTEKQ QLLDTLRTTD QYQAQLQELN SKIKVMSEVE 
ERSLLYRDLH DGAGQSLHAV CLHLKMIADG RGGYGDLKSL ASELAGEIAD ISAEIRDIAH 
HLRPAYLQEI TLDRAIIKRC EMLGRRGVPI SISCVGDFSS LSCQVSENLY RISQEAIANA 
DRHAAATLIT VRLTRVDNAL TLLIADNGCG IKDVSTNKGV GLRIIEERVS LIGGKLDMAS 
TASGTTITVT LELP