Gene Aazo_1544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1544
Symbol
ID	9339336
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	1615525
End bp	1617645
Gene Length	2121 bp
Protein Length	706 aa
Translation table	11
GC content	43%
IMG OID
Product	RDD domain-containing protein
Protein accession	YP_003720858
Protein GI	298490681
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGACCC CAACTGTCAG GAGAAATATT AATCAATCAA GCCAGTCCCA AGAACCTGAA 
AAAGTTAATT CCCTCCCTCT GGGAACAAGA CGGTTGGCCG CTTGGGCAGT CGAAATCACA 
CTAGTAGTTG CCAGCGGGTT AGTCCCCTTT GGCATGGGCG TTTATGCCAA TTCTCGCAGC 
GATCTTAACC GAGTACCTCT GAACCCGGTT TTGGTAGTCA CAGAAAGAGC AATTGCTCGG 
CCTTTAGCAC TACCAGTTAG TTATGGTATT AATAATGTTG CCAGTCCGAC TAATTTTTTA 
TGGACAATCG CCCTACTAGC ACCTATTACC CTCTCAGGGT GGCACTTGTA TTTACTGGGT 
AAAACTGGCA GCACCCTTCC CAAGCGTTGG TTTCGTGTCC GGGTAGTAAA TGAAGAAGGT 
CAAACCCCTG GTTTGGGAGT TGTGGTGGTT CGTGAAGGGC TAGGACGCTG GACTGCACCA 
GTTTCCATTG CTTATATACT ATGGCGTTAC AGCTTTACCT TTCCCAACTT AGGTTTATTC 
ACATTTTTAG CTGTCTTATT GGTGCTGGGG GAAGGAATGG GCTGGCCTTC GCAAAAACGT 
CGTCGTTCCT TCCATGATCA GTTAGTAGGT ACATATACCA TAGATGCTAG AGACATCAAC 
AGATGGGTAA AAACTTCTCC AGAAAATACT AGTGAACAGT TACCGCTGGA AAACGTTCAG 
GAAGTAAGTA CATGTACTCA GCCGCCTAGT CCCACAAATA TAATCCGACG CAGCCCCAGT 
TTCACCTTAT TTGTAGTCGG GCTAACGAGT ATGATAGCGG TATTATCAAC ACTAGTTGGT 
ACACAAATTT ACATCCAAAA TCAAGAAAGC TTGCGTAAGA TGGAGCAAAT CAACAGCCAG 
AAATTTCTCG AACTTGTCAA AGAACTTAAT CCTAGCTCTG GAGTCACCAA TGAAGAACGC 
CAGAGAGCAA TTCTAGCATT AGGTGGTATG AATGATACAC AATCAATTAA ATTTCTCGTA 
GATTTGCTGG TGAAGGAAAC TGACCCCAGC ACTATAGATA CTATACAGCA AGCCTTGGCC 
AATATTGGAC CCAAAGCCAT ACCAGAACTA AAACGCATGA ATTTGTTTCT CGCCGGAGAA 
GTAGAATCAG TCAGTACTTT CCGAAATATT CGGCAACAGC AGTTAAGTCT TAACCAACAG 
GCAATCAACA AAATTCTCTC TGTCTACACT GGCAAAGTTA AGGACATAGA TTTAAGTAAT 
GCCCAATTGG GTTCAAAAAG CTCTGAGGAA AATTCTTTAT TTAAATTGGT ACTGGACAAT 
ACTGATTTAT CTGGAGTAGT TTTTAAATCT GCCAACCTTA ACCAAGCCAG TTTAAAAGCT 
AGTCGCTTCC GCAGTGCTGG TGAAGATGGA CGTTGGGATA CTTATGATGA TGCGATCGCT 
GATTTGAGTA AAATTCAAAT GAAGCAAGCT AACCTCACTG AAGCTAATCT TAGTCGTGTA 
TTGATGAGTC GCAGTGATTT AAGCCGTTCC ATCCTCAATA AAGCCAACAT GTCCCATGCT 
AAATTAGTGG GAACTAACCT CAGCAGTACC CAACTAATAG GTAGCGATTT GCAAAAAACA 
ATTTTAGAAG ATGCAATTCT CACAGGAGCA GACATCAGCG ACGCAAAATT AATGGAAGCA 
GATTTGTATG CTGCTAATTT AGGTCGTGTT TCTGCCATTG GTACACAATT ATCACACGCC 
AACTTAACCA ACACAGACTG GCAAGGTGCA GACTTATCAG AAGCCTATTT AGATAATGCT 
AACCTCACCA ATGCTAACTT TAGTGCAGCT CGTTTATTAG GTGCTGTTTT ACGCTCTACC 
AACATGAAAA ACGCCAACCT GCGGAATGCT GATTTAAGCC GTGCAGATTT ACGGGGGGCA 
AATTTGGAAG GAGCCGATTT TCAAGGAACT ATTCTCTTCC CTGGTAAACA AGACCCCAGA 
GATCAATTTG TCCAAACTTC CGATCTCGGT TCACAAGCAG CTATAGTCCA AGGAGTTGAT 
TTTAGCCAAG CTAAAAATTT AGATCCCCAG CAACTAGCTT TCATTTGTAC CAAGGGTGGT 
ATTCATTCCC GTTGTCCATA G

Protein sequence

MTTPTVRRNI NQSSQSQEPE KVNSLPLGTR RLAAWAVEIT LVVASGLVPF GMGVYANSRS 
DLNRVPLNPV LVVTERAIAR PLALPVSYGI NNVASPTNFL WTIALLAPIT LSGWHLYLLG 
KTGSTLPKRW FRVRVVNEEG QTPGLGVVVV REGLGRWTAP VSIAYILWRY SFTFPNLGLF 
TFLAVLLVLG EGMGWPSQKR RRSFHDQLVG TYTIDARDIN RWVKTSPENT SEQLPLENVQ 
EVSTCTQPPS PTNIIRRSPS FTLFVVGLTS MIAVLSTLVG TQIYIQNQES LRKMEQINSQ 
KFLELVKELN PSSGVTNEER QRAILALGGM NDTQSIKFLV DLLVKETDPS TIDTIQQALA 
NIGPKAIPEL KRMNLFLAGE VESVSTFRNI RQQQLSLNQQ AINKILSVYT GKVKDIDLSN 
AQLGSKSSEE NSLFKLVLDN TDLSGVVFKS ANLNQASLKA SRFRSAGEDG RWDTYDDAIA 
DLSKIQMKQA NLTEANLSRV LMSRSDLSRS ILNKANMSHA KLVGTNLSST QLIGSDLQKT 
ILEDAILTGA DISDAKLMEA DLYAANLGRV SAIGTQLSHA NLTNTDWQGA DLSEAYLDNA 
NLTNANFSAA RLLGAVLRST NMKNANLRNA DLSRADLRGA NLEGADFQGT ILFPGKQDPR 
DQFVQTSDLG SQAAIVQGVD FSQAKNLDPQ QLAFICTKGG IHSRCP