Gene Aazo_4712 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4712
Symbol
ID	9342519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	4816804
End bp	4818162
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	39%
IMG OID
Product	hypothetical protein
Protein accession	YP_003723035
Protein GI	298492858
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.184255
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGTGGTT TTCCTCAGTT AATTTGGACA GATGTGGGGT TACGATTGTT GTCAGTGCTA 
TTGCTGATTG CAATTAATGC CTTTTTTGTC ACGGCGGAAT TTTCAATGGT AACGGTGCGG 
CGCACTCGGA TTCATCAGCT GGTTCAGGCT GGTGATATAC CTGCGATCGC AGTGGAAATG 
TTACAACGTA GTATTGACAG GTTGCTATCT ACGGCTCAAT TAGGTATTAC CCTATCTAGT 
TTGGCACTAG GTTGGATTGG AGAAAGTACA ATTGTTGTGC TGATGGAAGA ATGGTTAAAA 
TCCTGGACTG TACCCATCAG TTTAAGTAAC GTTCTGGCAC ATTCTCTCTC AGTTCCCATC 
ACCTTTTTTT TAATTGCTTA TTTACAAATT GTTTTAGGAG AATTGTTTCC TAAATCAGTA 
GCTATGTTGT ATTCAGAAAA ACTGGCAAGG TTTTTGGGTC CTTCTGTCAA AGCTATTGTT 
CGTTTTTTCA GTCCTGTGAT TTGGATTCTC AACCAATCCA CACGCTACCT ATTAAGATTA 
TTTGGGATTG AATACACTGG TCAGAGCTGG CGACCTCCTG TAACTCCGGA AGAATTGCAA 
TTAATTATCT CAACAGAACG AGAATCTACC GGTTTAGAGT TATCAGAGCG AGAATTACTC 
AATAATGTTT TTGAATTTGG GGATATAACC GCTGAAGATG TCATGATTCC CCGTACTAGC 
ATTATCGCTT TACCAGAAGA TGCTAGTTTC CACACCTTAC TACAAGAAAT GATCTTAACA 
GGGCATTCCC GTTATCCCAT TATTGGTGAA TCTTTAGACG ATATTTGCGG TATTGTTTAT 
TTTCAAGATT TAGCAAGACC TTTAGCTACT GGAAAACTGA ATTTAGAAAC ACAAATTCAA 
CCTTGGATGC GTTCTCCTCG CTTTGTTCCA GAACAAACTC TTTTGAGTGA ACTTTTGCCA 
ATGATGCAGC AAGAAAAACC AGCTATGGTG ATTGTGGTGA ATGAATTTGG TGGTACTGTG 
GGATTAGTTA CAATTCAAGA TGTAATTGCA GAAATTATCG GTAATGCCGG TGAACCAGGA 
ATTAGTGATG ACTTACTAAT TCAAATGTTA GATAAGCAAA CATTTTTAGT ACAAGCACAA 
GTGAATCTGG AAGAACTCAA TGAGGTCTTA CATCTCAATT TACCTCTGAT ACGAGAATAT 
CAAACATTAG GAGGATTTGT ACTCTACCAG TGGCAAAAAA TCCCCGCTAA AGGCGAAATA 
TTCCACTATG GTAATCTTGA ATTCACTGTA ATATCAGTTA TCGGACCACG CTTGCACCAA 
ATTCAAATCA GAAGGTTACT AGATGAATGT TCAGCTTAA

Protein sequence

MSGFPQLIWT DVGLRLLSVL LLIAINAFFV TAEFSMVTVR RTRIHQLVQA GDIPAIAVEM 
LQRSIDRLLS TAQLGITLSS LALGWIGEST IVVLMEEWLK SWTVPISLSN VLAHSLSVPI 
TFFLIAYLQI VLGELFPKSV AMLYSEKLAR FLGPSVKAIV RFFSPVIWIL NQSTRYLLRL 
FGIEYTGQSW RPPVTPEELQ LIISTEREST GLELSERELL NNVFEFGDIT AEDVMIPRTS 
IIALPEDASF HTLLQEMILT GHSRYPIIGE SLDDICGIVY FQDLARPLAT GKLNLETQIQ 
PWMRSPRFVP EQTLLSELLP MMQQEKPAMV IVVNEFGGTV GLVTIQDVIA EIIGNAGEPG 
ISDDLLIQML DKQTFLVQAQ VNLEELNEVL HLNLPLIREY QTLGGFVLYQ WQKIPAKGEI 
FHYGNLEFTV ISVIGPRLHQ IQIRRLLDEC SA