Gene Aazo_0601 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_0601
Symbol
ID	9338387
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	631731
End bp	633371
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	40%
IMG OID
Product	hypothetical protein
Protein accession	YP_003720212
Protein GI	298490035
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATATA GCGGTTTTCA CATCTCTACT TTATCTTTAG GCGCTAGTCT AACCGCTTTG 
TTGGTAATTG CTAGTAGTTC CATGCTATTA ACCAGTCAAG TAAATGCTGG TTCTCCTCCT 
ACTGTGATTG CACAAATTCC AGCAAGTGCA ACAGTGATTT ATGTTAATCC TGTGATCGGT 
CAAGATAGTT CTAGTGCTGG TATTACCCCA GAAGCACCCT ATAAAACTAT TACCTTCGCT 
CTTTCGCAGG CTAAATCAAA TACAGTGATT AAACTCGCTC CTGGTACCTA TACTAAGGAT 
ACTGGGGAAA CTTTTCCCTT ACTGCTTAAA CTAGGAGTGA TACTTGTCGG TAATGAATCT 
ATCAAAGGTC AAGGAACAGT CATCATCGGT GGTGGTCATT ATATCAGTCG TACCTTTGCT 
AGACAAGATA TTACCATCCT AGCGGAAAAT ACTACTATTG CTGGTATTAC TGTTACCAAC 
CCTAATCAAC GAGGTACGGC TGTTTGGGTA GAGTCAAGTA GTCCAACTAT CAAAAACAAT 
ACTTTTACTG ACAGCATCAG AGACGGTGTT TTCGTTACAG GTACAGGTAA TCCCAAAATT 
GAAAACAACC TTTTTATCAA AAACCGGGGT AATGGGATTT CAATAACTAA ATATGCTCAA 
GGTGAGATAC GCAACAACTC ATTTGAAGAT ACTGGTTTTG GTTTGGCTAT TGGTGGTAGT 
TCGACACCCT TGGTAGAAGG AAACCAAATT CTTCAAAACC AAGACGGTAT ATTTATCTCC 
GAATCTGCTA AACCTATTTT GCGTAAGAAT GTCATTCAGA ATAATAGGCG CGATGGTATT 
GTCGCAACTA TTGACGCTCT ACCCAATCTT GGTACTAATG ACAATCCTGG TAGTAATCTC 
ATCCGTAATA ACACTCGTTA TGACTTGAAT AATTCTACTA AGGTTAACAG GATTGTTGCT 
ATTGGCAACG ATTTTGATCA AAAGCGGATT TTTGGCGCAG TAGATTTTGT GGCTGCAACT 
GTTAACCCTC CTACAGGTGG AGGTACTACA GGTTCTACCG GTTTTCAGGA TGTACCAACA 
GGTTATTGGG CAAAAGCCTA CATTGAAGCT TTGGCTTCCC AAAATATTAT TGCGGGTTTT 
CCTGATGGTA CTTTTAAGCC TAATGATCCT GTAACTCGCG CTCAATTTGC TACCATTATA 
ACCAAAGCTT TGGCACCACC GTCTAGACGG ACAGCAATTC GATTTAACGA TGTAAATAGC 
AATTTTTGGG CTTATGGAGC AATTCAATCA GCTTACCAAA GTCAATTTGT GGCTGGGTAT 
CCTGATGGTA CTTTTAAACC ACAGCAACAA ATTCCTAGAG TTCAGGCTTT AGTTGCTCTA 
GCTAATGGTT TAAACCTTAC TGCCAACAAT GAAAGTATTC TTAGTTTTTA CACAGATGCT 
GCTCAAATCC CTAATTATGC AATGGGATCT GTTGCTGCTG CAACAGTCAG GCAATTAGTG 
GTTAACTATC CCACTGTAAA ATTACTTGAT CCCAATCGTG AAGCTACTAG AGCAGAAATT 
GCAGCTTTTG TTTATCAAGC ACTTGTCACT ATTGGACGGG CGCAACCAAC ACCTTCTCCT 
TATGTGGTAA CGGCTCAGTA G

Protein sequence

MKYSGFHIST LSLGASLTAL LVIASSSMLL TSQVNAGSPP TVIAQIPASA TVIYVNPVIG 
QDSSSAGITP EAPYKTITFA LSQAKSNTVI KLAPGTYTKD TGETFPLLLK LGVILVGNES 
IKGQGTVIIG GGHYISRTFA RQDITILAEN TTIAGITVTN PNQRGTAVWV ESSSPTIKNN 
TFTDSIRDGV FVTGTGNPKI ENNLFIKNRG NGISITKYAQ GEIRNNSFED TGFGLAIGGS 
STPLVEGNQI LQNQDGIFIS ESAKPILRKN VIQNNRRDGI VATIDALPNL GTNDNPGSNL 
IRNNTRYDLN NSTKVNRIVA IGNDFDQKRI FGAVDFVAAT VNPPTGGGTT GSTGFQDVPT 
GYWAKAYIEA LASQNIIAGF PDGTFKPNDP VTRAQFATII TKALAPPSRR TAIRFNDVNS 
NFWAYGAIQS AYQSQFVAGY PDGTFKPQQQ IPRVQALVAL ANGLNLTANN ESILSFYTDA 
AQIPNYAMGS VAAATVRQLV VNYPTVKLLD PNREATRAEI AAFVYQALVT IGRAQPTPSP 
YVVTAQ