Gene PCC8801_0407 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0407
Symbol
ID	7103364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	410213
End bp	412903
Gene Length	2691 bp
Protein Length	896 aa
Translation table	11
GC content	43%
IMG OID	643473516
Product	CheA signal transduction histidine kinase
Protein accession	YP_002370660
Protein GI	218245289
COG category	[K] Transcription [N] Cell motility [T] Signal transduction mechanisms
COG ID	[COG0643] Chemotaxis protein histidine kinase and related kinases [COG0745] Response regulators consisting of a CheY-like receiver domain and a winged-helix DNA-binding domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGAGATA ATCTAGACTT AAGCAATTGC TCCATGCTAG ATCTGTTCAG CATGGAAGTA 
GAAAGTCAAG GGGAAGTCCT CAACGATAAC CTCTTGAACT TAGAAAATCA ACTTCAGGAG 
TCCCAAGGAC AAGCCAGTGC TAGTTCCCTT GCCTTATTAG AGTCCCTGAT GCGAGCCTCT 
CACTCCATCA AGGGAGCCGC TCGAATTGTC CAACTTGAAC CCGCCGTCAG AATTGCCCAT 
GTCATGGAAG ATTGCTTTAT GGCGGCCATG GATCGCACCA TTAATTTGCA ATCGGACCAC 
ATTGATCTGC TCTTACAAGC CGTCGATTTT CTCCTAGCCA TTGGTCAAGT GGGAGAAGCC 
AATATCAATC ATTGGCTTGG AGAACATCAA GGGGAAGCAG AACAATTAGT GATCTCTATT 
GCTTCTATCA TGGGAAGACG CAAAAGCGAT CGCGGTTCTG ATAAAAGTCC CCAAACACAA 
CGAACCACAA CGACTCCACA ACCCCCACCC CCTTCCCCGG CAAAAAGTCA AAAAATCCCC 
AAGACTCCAG AACTTTTAAC CCCTCCTCCA TCGAACTCAA ACCGTCGAAA AACCCCAGAA 
ACCCCAGAAG ACGAATTTTT CTTAGGATCT ACCCTAGAAG CTGACGAAGA GCCAGAAAAC 
TCAAGTTTTC CAGATTTTGA ACTCTCCTTA GATGATGTCT TTTCTGAGGA TACAGATATA 
CAGTTAGGTA AATCCAAGTA TATACAAGAT ATTTCTCATA TTTCTGAGGA GGAGTCAACC 
GGAAATCTGC TCACTGAGTC AGCGTCAAAA TTAGAGTCCA CTTTTGACCT ATCCGAAGAA 
GTGATGACTT GGGTAGAAGA CGACAACGAA CCGATTAGTC AAGGGACTTC TTCCCTAACC 
TCTACCTCAA AAGATGAACC CATCACCTCT ATCTCATCAG GCGGCGGTTC TTCTAAAGAT 
CGTTTTGTCC GAGTAAGTGC AGAAGGATTA AATCGCCTGA TGGGATTAGC GGGAGAATCC 
CTCGTGGAAG CGACGGCCTT AAGTCCGATG GCAGACTCCT TTATCACCCT CAAACGCAGT 
CAACTGGATT TATCGCGCTT GCTCGAACAA TTACAAATGA TCTTGAGTCA GCTTTCTTTA 
GGCAAAGAAA TGGAGGACTT TATCACTGAT ATTGTCGAAA AAGAACGAGA ATGTCGCACC 
ATTTTAGGCG ATCGCCTCAG TGACCTAGAA CAATTTGCCT ATCGTTCCTT TAATTTATCC 
GATCGCCTCT ATCGAGAAGT GATTGCCACC CACATGCGTC CCTTTGAAGA AGGAGTCACC 
GGGTTTCCGC GCATGGTACG AGATATATCC CGAAAACTCA ATAAACGAGT CAAATTAGAG 
ATTGCTGGAC GCATGACCAT GGTAGATCGG GATATTCTGC GAAAATTAGA AGCTCCTCTG 
ACCCATATTT TAAGCAATTC CATCGATCAT GGCATTGAAT CCCCTGAAGA ACGGGTCAAA 
AAAGGAAAAC CCCCAGAGGG ACATATTCTC CTCGAAGCCA GTCACCGTTT TGGGATGTTG 
TCGATTAATG TGATAGACGA CGGACGGGGA ATTGAACTGG AGAAATTGCG TCAATCAATC 
GTTGATAAAG GATTAGTTCC CGCAGAAATG GCCAAACAAC TCAATGAAGC TGAGTTGATG 
GAATTTATCT TTTTACCCAA TTTTTCCACC AGTAAGACCG TCACCGATAT CTCCGGTCGT 
GGGGTGGGAT TAAATATTGC GAAAACTATG GTACAAGAAG TTGGAGGCAA CCTTCAGGCA 
GTTTCTCGGC CAGGAGAAGG TATGAGTTTT CATTTCCAAT TACCTCTAAC CCTTTCGGTG 
ATTCGCACCC TTTTAGTCGA TATTGCTGGT CAACCCTACG CCTTCCCCTT ATCCCGTATC 
GATCAAATTT TGACCCTCAA TTATAAAGAT ATTCACTCCG TAGAAAATCG ACAATACTTT 
ACCCTTGAAG GGCAAAATAT TGGCTTAGTT AGAGCCGATC AAGTGTTAAA TATTTCGTCT 
CCGGCTTCTC CCTTAGAACC CCTATCAATT GTTATTTTAA GTGACCAAAC TAATCGCTAT 
GGCTTGGTTG TTGATCGCTT TATTGGGGAA AAAAGTTTAG TGGTTCGTCC CTTAGATTCT 
CGCTTAGGAA AAGTTCAAGA TATTAGTGGT GCAGCCATTC TCGAAGATGG TTCGCCGATT 
CTTATTTTAG ATGTGTTAGA TTTAGTGCGA TCGCTTGATA AACTCTTGGC TAATGTTCAA 
GTTAATCAAA TTAAAACCGA GGAAGAAGCA GAGTGGAAAG AAAATAAAAA GCATATTTTA 
GTCGTTGATG ATTCCATTAC CGTCCGAGAA ATGGAAAAAA AATTATTGCA AAATCAGGGC 
TATCTTGTGG ATGTCGCTGT TGATGGAATG GAAGGGTGGA ATGCCGTGCG AATGGGCAAT 
TATGACCTCG TGATTAGTGA TATAGATATG CCCCGGATGA ATGGGATTAA ATTAGTCAGT 
CAAATCAAAA ATCATCCTAA TTTAAAATCA ATCCCTGTGA TTATTGTTTC CTATAAAGAT 
CGCGAAGAAG ATCGCCTACA AGGCTTAGAA GCAGGAGCCG ATTATTACTT AACAAAAAGT 
AGTTTCCATG ATGATACTTT AATCAATGCC GTTGTTGATT TAATTGGGTA A

Protein sequence

MRDNLDLSNC SMLDLFSMEV ESQGEVLNDN LLNLENQLQE SQGQASASSL ALLESLMRAS 
HSIKGAARIV QLEPAVRIAH VMEDCFMAAM DRTINLQSDH IDLLLQAVDF LLAIGQVGEA 
NINHWLGEHQ GEAEQLVISI ASIMGRRKSD RGSDKSPQTQ RTTTTPQPPP PSPAKSQKIP 
KTPELLTPPP SNSNRRKTPE TPEDEFFLGS TLEADEEPEN SSFPDFELSL DDVFSEDTDI 
QLGKSKYIQD ISHISEEEST GNLLTESASK LESTFDLSEE VMTWVEDDNE PISQGTSSLT 
STSKDEPITS ISSGGGSSKD RFVRVSAEGL NRLMGLAGES LVEATALSPM ADSFITLKRS 
QLDLSRLLEQ LQMILSQLSL GKEMEDFITD IVEKERECRT ILGDRLSDLE QFAYRSFNLS 
DRLYREVIAT HMRPFEEGVT GFPRMVRDIS RKLNKRVKLE IAGRMTMVDR DILRKLEAPL 
THILSNSIDH GIESPEERVK KGKPPEGHIL LEASHRFGML SINVIDDGRG IELEKLRQSI 
VDKGLVPAEM AKQLNEAELM EFIFLPNFST SKTVTDISGR GVGLNIAKTM VQEVGGNLQA 
VSRPGEGMSF HFQLPLTLSV IRTLLVDIAG QPYAFPLSRI DQILTLNYKD IHSVENRQYF 
TLEGQNIGLV RADQVLNISS PASPLEPLSI VILSDQTNRY GLVVDRFIGE KSLVVRPLDS 
RLGKVQDISG AAILEDGSPI LILDVLDLVR SLDKLLANVQ VNQIKTEEEA EWKENKKHIL 
VVDDSITVRE MEKKLLQNQG YLVDVAVDGM EGWNAVRMGN YDLVISDIDM PRMNGIKLVS 
QIKNHPNLKS IPVIIVSYKD REEDRLQGLE AGADYYLTKS SFHDDTLINA VVDLIG