Gene Aazo_4690 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4690
Symbol
ID	9342497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	4793112
End bp	4794335
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	37%
IMG OID
Product	TPR repeat-containing protein
Protein accession	YP_003723023
Protein GI	298492846
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.040929
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAAGAC ATTTCAGTGT GATAGTTACT ACTTTTATTT TCTGGCATCT GTGCAGTTTT 
GTCACACTGG CAGAGGGTAA AAAGCCAGAA CAAATGGATA AATTCCCTCC AGGTCCGTTG 
GAGATGACTA CTCCTGATCC TTTAGTACGG GGTTCTGTGG AAAAACAGCC ATTAACCTTG 
GAAGAGTTGC AAAAGTTGGA AACTGCGCTA GATGAGTTAA ATCAAGAAGC TACAACGACT 
CTACAAATAG GGGATAAGCT GACTGCTTTT GATATTTGGA ATCGAGAATT ACGACTGCGG 
CGTTTTTTAG GTCCATTGGC TGAGGTACAC GCATTATCAG GGGTCGGTGC GATCGCATGG 
AATGAAAATG AGCGTCAACA GGTAAAATAT ATTACTGAGA GATTGCAGGT AATTGAAAAA 
CAGATGCTCA AGCAAAAAAG CACTGATTTA GAATTATGGC GATCGCTTGG TGAAGCTTAC 
CAAAATATTC ATGTTCCTAA GTTGGCTGTG GTAGCTTATC AGCAGATTTT AATATTGTTC 
AGACAGCAGA ATAATACTAC TTCTGAGTTA GGAACTCTTA ATAAGATTGC GGAACTACAT 
TTAAGTTGGT TTGATTATTC CCAAGCTGCT ACAATTTACC AAGAACTGTT AAATCTTGCT 
ATTAGTCAAG GTGATAGACC AAATGAATTA GGATACTTGC AACAACTGGT TCACATTTTT 
GAAAAAGCAA AACAGCATCA ACAAGCAATT AATGTACTGA GTAGACTAGC AGGAATTTAC 
ACCAGTGATG GTAATCTTAC CCAGATTCCA GCTTTAAAAA TTGCGATCGC ACAAAATTAT 
CAATCTTTAG CGCGGGAAAA TCCCAACTTA CTACAAGAAG CCTTTAACAA GTATCAAGAG 
GCTTATGTTA CAGCATGGCA ATCACAACAA TATGTGACTG CTAGTGAAGC TTTACAGAAA 
TTAATCAAGC TTTACCGTTC CCAAAACCAA ATTGATGAAG CTTTGCAAAC TGCTGAGATT 
TTATTAGAAA CAGAAACACT AGCTACTAAT TTTTACGGTT TGATGCAAGC TTATGATCAA 
ATAGGACAAT TGTATTTAGA AAAGAAAGAA GATGGAAAAG CACTAACAGC TTTTCAAAAA 
GGATTAGAAA TAGCCCAACA ACTCAAATAT CAAGAAACAT ACTTTTCCCA AAGAATTGAA 
ACATTATCAA AAGGTAACTT TTAA

Protein sequence

MLRHFSVIVT TFIFWHLCSF VTLAEGKKPE QMDKFPPGPL EMTTPDPLVR GSVEKQPLTL 
EELQKLETAL DELNQEATTT LQIGDKLTAF DIWNRELRLR RFLGPLAEVH ALSGVGAIAW 
NENERQQVKY ITERLQVIEK QMLKQKSTDL ELWRSLGEAY QNIHVPKLAV VAYQQILILF 
RQQNNTTSEL GTLNKIAELH LSWFDYSQAA TIYQELLNLA ISQGDRPNEL GYLQQLVHIF 
EKAKQHQQAI NVLSRLAGIY TSDGNLTQIP ALKIAIAQNY QSLARENPNL LQEAFNKYQE 
AYVTAWQSQQ YVTASEALQK LIKLYRSQNQ IDEALQTAEI LLETETLATN FYGLMQAYDQ 
IGQLYLEKKE DGKALTAFQK GLEIAQQLKY QETYFSQRIE TLSKGNF