Gene Ava_4401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4401
Symbol
ID	3680528
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	5514154
End bp	5516079
Gene Length	1926 bp
Protein Length	641 aa
Translation table	11
GC content	41%
IMG OID	637719754
Product	multi-sensor Signal transduction histidine kinase
Protein accession	YP_324894
Protein GI	75910598
COG category	[T] Signal transduction mechanisms
COG ID	[COG2203] FOG: GAF domain [COG4191] Signal transduction histidine kinase regulating C4-dicarboxylate transport system
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00000108821
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.00000304156
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAGACCAT CAAATAATCA AGTTGCCAAA CTACCAGTTC ATCAGACAAA AGCGCCTCTG 
CAAATTGGAG AATCTGGAAA AAAATACTTT AACTTCAAAG TTAGTTTAGA AACCGAAAAC 
AATTTATATC AAGTTATAGA AAATTTTCAT AAAATTATTA TTGTATTCAC GAGTGATGGT 
CATGTTTGCT ACACTTCACC TAATGTCACA GAAACTTTAG GGTATGAAGT AATAGAACTG 
GAAGGTAAAT CTTTCGCTTC TTTTGTCCAC AATGATGATG TGCGACTATT TACTGATTAT 
TTATCCACAG TTGCCAAATC TGGCAACAAG CATCAGCCGC TAGAATACCG GATAAAAGCC 
AAAGATGGTA GCTGGCGATG GCAGGAAATT AGCACATCTG TCTTTAAAGA TGAAAATGGT 
AATGTTGTGT ATTTTGTTGG CATTACTCAC GATATAACTG ACCGCAAACT TACAGAAGCG 
GCGCTAGCAG AAAGAATCTT GTTAGCTAAC TTTCGGACAG CAATTGATAA TGTTTTTTCT 
CAAAATCATA CATTACAACA GTTAATGCGT GGCTGTACTG AGACTATGGT GACACATCTC 
AATGCAGCCT TTGCCCGCAT CTGGACACTA AATAAACAAA ATAACATCCT CGAATTGCAA 
GTTAGTTCGG GGATGTATAC CCACATCGAT GGCCCCCATA GATTTGTACC AGTCGGTAAA 
TTCAAAATAG GGTTAATCGC CGAAGAAGCC AAACCCCATC TCACCAACTC TGTACAAACC 
GACCCCCGTG TAGGGAATAA AGAGTGGGCA AAGCAAGAGG GAATGATTGC CTTTGCTGGC 
TATCCCTTGA TTGTGGAAGG AGAGATATTA GGGGTCATCG CCATGTTCTC TCGCCAAGTA 
CTGAGCGAAT CTACCTTTGA AGCTTTGAGA ATTACAGCTC ATGAAGTTGC TATCGGCATT 
AAGCGCAAGC AGATTGAAGA AGAACTAAGA AAATCCGAAG CTAAATACCG AGAAATTGCC 
CAAGCGTCCC AAGAAAAAGC CCAAAAATTA GAAGCAGCTT TATGGGAACT CCAACAAACC 
CAGGCACAAT TAATTCAAAC GGAGAAAATG TCCAGTTTAG GACAGTTAGT CGCGGGTGTT 
GCCCATGAGA TTAATAATCC CGTGAATTTT ATCTACGGTA ATATCACCCA TACCCGTGAA 
TATATAGAGG ATTTGCTTTA CTTGGTAAAA CTCTATCAAA GTCACTACAA CCCGGTAGCA 
CCAGAAATCC TAGACCATAT CTACGGGATG GATTTAGAGT TTATTTCTCA AGATTTGCCC 
AAAGTCCTCA ATTCAATGCA CATGGGAGCA GAACGTATTC GACAGATAGT CCTCTCTTTG 
CGTAACTTTT CTCGCCTAGA CGAAGATGGC ATGAAAGCAG TAGATATTCA TGAAGGTATC 
GATAATACAT TGCTATTATT GCAAAATCGT CTGAAAGCTA AACCAGGCTG TAGCGAGATT 
CAAGTAATTA AAGAGTACGG CAACCTACCG AATATCTTAT GTCACGCCGG ACAACTCAAT 
CAAGTATTTA TGAATTTACT GACTAATGCA ATTGACGCTT TGGAAGAGTC TGTTGCCAGT 
AGTCAGTTGT CAGTGGTAAA TAGTAAAACA ACTAACAATC CCCGAATTCT GATTCGGACT 
GAACTTACCA CCGAAAATCA GGTGATGATC TGCATTGCTG ACAACGGGAT GGGAATGGCA 
GAGAAAGTTC GTAGCCAGCT ATTTGACCCT TTCTTTACCA CTAAACCCAT AGGTAAAGGC 
ACTGGTATGG GACTATCAAT TAGTTACCAA ATTGTGGTGA AAAACCATCA GGGACAGTTA 
CAGTGTATCT CTGCGCCAGG AAAGGGGGCT GAGTTTATCA TTACAATTCC AACTGGTGAT 
GGGTGA

Protein sequence

MRPSNNQVAK LPVHQTKAPL QIGESGKKYF NFKVSLETEN NLYQVIENFH KIIIVFTSDG 
HVCYTSPNVT ETLGYEVIEL EGKSFASFVH NDDVRLFTDY LSTVAKSGNK HQPLEYRIKA 
KDGSWRWQEI STSVFKDENG NVVYFVGITH DITDRKLTEA ALAERILLAN FRTAIDNVFS 
QNHTLQQLMR GCTETMVTHL NAAFARIWTL NKQNNILELQ VSSGMYTHID GPHRFVPVGK 
FKIGLIAEEA KPHLTNSVQT DPRVGNKEWA KQEGMIAFAG YPLIVEGEIL GVIAMFSRQV 
LSESTFEALR ITAHEVAIGI KRKQIEEELR KSEAKYREIA QASQEKAQKL EAALWELQQT 
QAQLIQTEKM SSLGQLVAGV AHEINNPVNF IYGNITHTRE YIEDLLYLVK LYQSHYNPVA 
PEILDHIYGM DLEFISQDLP KVLNSMHMGA ERIRQIVLSL RNFSRLDEDG MKAVDIHEGI 
DNTLLLLQNR LKAKPGCSEI QVIKEYGNLP NILCHAGQLN QVFMNLLTNA IDALEESVAS 
SQLSVVNSKT TNNPRILIRT ELTTENQVMI CIADNGMGMA EKVRSQLFDP FFTTKPIGKG 
TGMGLSISYQ IVVKNHQGQL QCISAPGKGA EFIITIPTGD G