Gene Aazo_1133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1133
Symbol
ID	9338928
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	1217250
End bp	1218347
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	41%
IMG OID
Product	heat-inducible transcription repressor HrcA
Protein accession	YP_003720588
Protein GI	298490411
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.382582
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAGTCC AGCTGACAAA TCGACAACAG CATATACTTT GGGCAACTGT GCGCCACTAT 
ATTGCTACAG CAGAACCTGT TGGTTCTAAA GCCCTAATTG AAGAATTTGA CCTTGGTGTT 
AGTTCCGCAA CCATCCGCAA TGTCATGGGC GTTTTAGAAA AATCAGGATT ACTTTACCAA 
CCACATACTT CTGCGGGTAG AATACCTTCT GATTCTGGTT ATCGGATTTA TGTTGATCAA 
CTTATTACAC CTTCTCTGCG AGACCCTACA CGAACAGAAG CTTTAACTAA AGAAGTGGAA 
AATGCTTTAC AACAACGTCT CCATTGGGAA GATTGGAGTT TGGAAGCTTT TTTACAAGGT 
GCGGCTCAAA TTTTGGCAAC TTTGAGTGGC TGTATTACCT TGATTACTAT GCCACAAACA 
ACTACAGTGC AGTTAATACA TTTGCAATTA GTGCAAATTG AAGGTGATAG AATTATGCTG 
ATTGTGGTGA CAGATAGTTA TGAGACACAT TCTAAGGTGA TGGATTTGTT CACTGCGTCG 
TCAGAAACTA AACCTGATCC AGCAGTAATT GATCACGAAT TACAGATTGT TTCTAACTTT 
TTGAATAGCC ATTTACGAGG ACGAAGTTTA TTAGAATTAG CCAAACTGGA TTGGAGTGAA 
TTAGATCAAG AGTTTCAACG CTATGGAGAA TTCTTGAAAA ATTCAGTTGC AGAATTAGCG 
CGTCGGACCG TGGTACCAAA TGCAACACAA ATTATGGTGA GGGGTGTGGG TGAGGTGTTA 
CGTCAACCAG AGTTTTCTCA AGTACAACAA GTACAAACTA TCATCCATCT TTTAGAAGAA 
GAACAAGAGC AATTATGGCG GTTAATTTGT GAAGAATCAG ATGTTGAGGA AATGGGTAAG 
CCAAGGGTGA CAGTGAGAAT TGGGACAGAA AATCCACTAG AACCGATTCG GACTTGTTCA 
TTAATTTCGT CTACTTATCG TCGGGGTTCT ATCCCTGTGG GAAGTGTAGG TGTTTTGGGT 
CCAACTCGGT TAGACTATGA AGGTGCGATC GCAGTTGTGG CAGCCGCAGC AGATTATCTA 
TCGGAAGCTT TTAGTTAA

Protein sequence

MQVQLTNRQQ HILWATVRHY IATAEPVGSK ALIEEFDLGV SSATIRNVMG VLEKSGLLYQ 
PHTSAGRIPS DSGYRIYVDQ LITPSLRDPT RTEALTKEVE NALQQRLHWE DWSLEAFLQG 
AAQILATLSG CITLITMPQT TTVQLIHLQL VQIEGDRIML IVVTDSYETH SKVMDLFTAS 
SETKPDPAVI DHELQIVSNF LNSHLRGRSL LELAKLDWSE LDQEFQRYGE FLKNSVAELA 
RRTVVPNATQ IMVRGVGEVL RQPEFSQVQQ VQTIIHLLEE EQEQLWRLIC EESDVEEMGK 
PRVTVRIGTE NPLEPIRTCS LISSTYRRGS IPVGSVGVLG PTRLDYEGAI AVVAAAADYL 
SEAFS