Gene Aazo_4228 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4228
Symbol
ID	9342033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	4300295
End bp	4301824
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	38%
IMG OID
Product	winged helix family two component transcriptional regulator
Protein accession	YP_003722745
Protein GI	298492568
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.290807
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGATTC TGCTAGTAGA TGACGATGAA ATTATAGTAG AAGTTTTAAC AAAGCTGTTA 
GTACAGCAAA ACTATGTTGT AGATGTAGCC AGAGATGGTG AGGCTGCCTG GGAACTAGTA 
GAAGGCTTTC AGTATGATCT AATTTTGTTG GATGTGATGT TGCCAAAACT AGATGGAATC 
AGTTTTTGTC GTCGTCTAAG AGAGCAAAAA AGTCCTGTTT TAGTAATGCT TTTGACTGCC 
TGTGATACCA CAACTGATAA ACTGCAAGGG CTAGATAGGG GAGCAGATGA TTATGTTGTC 
AAACCGTTTA ATGTCCAAGA ATTGGCAGCT AGAGTCCCTG CCTTGACTCG TCGTGGAAGC 
TCCTCTCCTT ATCCTACACT GGTATGTGGT CATTTACACC TTGACCCAAA TTTACATGAG 
GTGAATTATC AAGAACATCT GCTACAGTTG AGTCGCAAAG AATACCTATT AGTGGAGTTG 
TTTCTCCGGA ACCAAAAACG GATTTACAGT TGCAGAGATA TTATTGATGA ACTATGGGCA 
TTTGATGCTG AACCACCCAA TGAATGGACA GTTAGATCCC ATATTACGAA TATTCGTCGC 
AACTTAAAAG CAGTTGGTGC AGATAATTTT TTGGAAACGG TTTATGGACA AGGATACAGG 
ATAAATCCTA CTTTTATAAA AAAATCCAAT CATTCCACTC ATATCAGTAA TGTTAATACA 
GATAAACAAG AAAATTCAGA TGCTTCGATT ACAGAAATTT GGCAGCACAC AAAAAACTTA 
ACTTTTGAAG GTCTAATTGT TTTAGAACAA GTGATTTCGT CTCTTGTATT CGGCATATTT 
GATGCAGAAC TTCTCAAAGA TGGTATACAG AAGGCCCATA AACTTGCTGG GTCTCTGGGT 
ATGTTTGGAT TTGAGCAAGG AAGTTTTTTA GCTAGACAAA TAGAAGTTTT ACTAGAATCT 
AGTTTTCACG TAGAATCGCA TTTTTCGCTA GGTTATCAAC AAAAAATAGA GCAGTTGCTG 
ATCTATTTAT GTCAAGACCT AGAAGTAACT ACTAATACTA ATGAGTTAAT TAATTTAACT 
GGTAAAAAAC TAGAAGAATT GAGCCAATCT GAACAAATTA ATGCCAAAGT TCTAGCAGTA 
GATGATGATC CACAAATTTT GCTGACCGTG CAAACATTAC TTGAACCTTT GGGTGTGCAG 
TTAACTTATT TGACTAATCC AGATCGTTTC TGGGAAACTG TGCCATATAA CCAACCAGAG 
TTTCTAATTC TGGATATTTA TATGCCTAGT GGCACTGAAG GTTTAGATTT GTGCCGGGCT 
GTAGGTCAAA ATGATGACTG GAACTGGCTA CCAATCCTAT TCTTGAGTAG CTGTACGGAT 
GTAGAAACCT TGCAAAAAGC ATTTGTTATA GGTGCAGATG ACTACTTAAC TAAGCCCATT 
GTGCCGAAGG AACTGTTGAT CAGAATTAGT AACGGTCTCC AACGCATCAG TACAATCAAG 
AATCAGATGG AAACAAATCT GATTAAATAA

Protein sequence

MRILLVDDDE IIVEVLTKLL VQQNYVVDVA RDGEAAWELV EGFQYDLILL DVMLPKLDGI 
SFCRRLREQK SPVLVMLLTA CDTTTDKLQG LDRGADDYVV KPFNVQELAA RVPALTRRGS 
SSPYPTLVCG HLHLDPNLHE VNYQEHLLQL SRKEYLLVEL FLRNQKRIYS CRDIIDELWA 
FDAEPPNEWT VRSHITNIRR NLKAVGADNF LETVYGQGYR INPTFIKKSN HSTHISNVNT 
DKQENSDASI TEIWQHTKNL TFEGLIVLEQ VISSLVFGIF DAELLKDGIQ KAHKLAGSLG 
MFGFEQGSFL ARQIEVLLES SFHVESHFSL GYQQKIEQLL IYLCQDLEVT TNTNELINLT 
GKKLEELSQS EQINAKVLAV DDDPQILLTV QTLLEPLGVQ LTYLTNPDRF WETVPYNQPE 
FLILDIYMPS GTEGLDLCRA VGQNDDWNWL PILFLSSCTD VETLQKAFVI GADDYLTKPI 
VPKELLIRIS NGLQRISTIK NQMETNLIK