Gene Ava_4086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4086
Symbol
ID	3681609
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	5077980
End bp	5079218
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	42%
IMG OID	637719437
Product	histidine kinase
Protein accession	YP_324585
Protein GI	75910289
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.3591
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGTAG TTATGGGACT GTCATCGGTG GTAGTGTATC ACTTTTTTGC TTATAGTCTC 
AGTCAGCAAT TAGATAGGCA GTTGTTGACG TTGGCGGATG CAGCAGCTCA TAATTTATCG 
GCTATTAAGG TGGATAAGAT GGCTGTAAAC CGCAAGATGC CGCGAATTTT AGATAATGAT 
GGGGATTTAG ATATTCCTTG GCAAGATTTA CGGTTATATC GTCAGAGTGT GGAATGGTTT 
GATGCTGGGC AGCAATTATT AGGAAAGGCA GGAAAGCCAT TTCCCGAAAC ACCATTTCTA 
ACTAATTTTC ACTCATGGCA GCAAAATGGC ATCAGGATAT TAACTATTCC GGTTTATTCT 
TCCAGAAAAA ATCAACAACT TTTAGGTTAT GTGCGTGTCA GTGCATCAAC AGTTGAAATA 
CAAAAAGAAC TGGAGAGACT GTTGATGGGT TTGGGTATTG GTGGTGTTTT GGGGATGGTT 
TTAATTAGTG GTACAGGTTG GTGGCTAACG AGTAAAGCCT TGCAACCGAT TGAGCAGAGT 
TTCCAGCAAT TACAACAGTT TACGGCGGAT GCGTCCCATG AATTACGCAG TCCTCTGACG 
GCGATTAAAA CGACTGTGGA AGTTATCCAA AGTCACCCAG AACGTATTCA TCCCAGTGAT 
GTCAAAAAAA TCGACATCAT AGAGGGTGCA ACACAGCAGA TGACGCACTT AGTAGAGGAT 
TTACTATTGT TAGCCAGAAG TGATTCTGCA CCTATAAGTT TGCCTAAAAC CGCAATTCCC 
ATACCCATAG ATGAAATTTT AATTGATTTA ATTGATACCT TACAGCCGCA GGCAAAATCT 
CAAGAAATTA CTTTAGAGGC TAACTTGATT GATGCGGTGT GGGTAAAGGG GGATGCACAT 
CAGTTACAAC GACTATTTGG TAATTTATTA GAAAATGCCC TGCAATATAC GTCTAATGGT 
GGTTTAGTCA GGGTAGAAAT CGTTAAAAGG GATGATTTTG TAGTGATTGA AGTGGCAGAT 
ACTGGTATTG GTATCGCACC TGAAAATCTG CCTTTTGTAT TTAATCGCTT TTGGCGAGCT 
GAAAAAGCCC GTTCTCGTCG TCAAGGTGGT TCGGGTTTGG GTTTAGCTAT TGCCCAAGCT 
ATTACTCATG CTCATGGTGG TGAGATTTCT GTGACGAGTA AAGTCGGTGT GGGAAGTTGT 
TTTCGCGTGA AGTTACCAGT ATTTAGGTTG GGCAATTAG

Protein sequence

MMVVMGLSSV VVYHFFAYSL SQQLDRQLLT LADAAAHNLS AIKVDKMAVN RKMPRILDND 
GDLDIPWQDL RLYRQSVEWF DAGQQLLGKA GKPFPETPFL TNFHSWQQNG IRILTIPVYS 
SRKNQQLLGY VRVSASTVEI QKELERLLMG LGIGGVLGMV LISGTGWWLT SKALQPIEQS 
FQQLQQFTAD ASHELRSPLT AIKTTVEVIQ SHPERIHPSD VKKIDIIEGA TQQMTHLVED 
LLLLARSDSA PISLPKTAIP IPIDEILIDL IDTLQPQAKS QEITLEANLI DAVWVKGDAH 
QLQRLFGNLL ENALQYTSNG GLVRVEIVKR DDFVVIEVAD TGIGIAPENL PFVFNRFWRA 
EKARSRRQGG SGLGLAIAQA ITHAHGGEIS VTSKVGVGSC FRVKLPVFRL GN