Gene Aazo_3647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3647
Symbol
ID	9341452
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	3713517
End bp	3715244
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	40%
IMG OID
Product	DNA repair protein RecN
Protein accession	YP_003722337
Protein GI	298492160
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGCTGT GCCTCAGAAT TGAGAATTTT GCCCTCATCG ACCAACTAGA GTTAGACTTT 
GGCGCTGGGT TGAATGTACT AACAGGGGAA ACCGGCGCGG GAAAGTCGAT TATTTTGGAT 
GCGATTGATG GGGTTTTAGG TGGGAAAGTC TCTAGTCGTG TGATTCGCAC GGGGACTAGT 
CGCGCTTTAG TAGAAGGGAC TTTTAGTATC AATCCTTTTC TGGCTGCTTG GTTGAGTGAA 
CAGGAAATTG ATTTAATTGA TGATAATGCT GTAGTTATTA GTCGAGAAAT TGCCGCAACT 
GCCAGTAATA TCCGCAGTAG GTCGCGGGTA AATGGTGTGT TGGTAAATCG GCAAATAATG 
GGAAGTTTGC GCGATCGCTT GGTGGAAATT ACTGCCCAAG GGCAAACTGT ACAAGTGGGA 
CAATCTGCCC AAGTTAGAGA CTGGTTAGAT GTATATGGTG GTGATTCTTT AATACAACAA 
CGGCAAAAGG TAGCTGTTGC TTTTAGTGCA TATCAACAAG CACACCAAAC TTCAGAAAAA 
CGTCGCACTT CGGAAAGAGA ACGCTTACAA CAATTCGATT TAATTACCTA TCAAGTTCAA 
GAATTGAGTG CAGCGAATCT CAACTATCCG CAAGAAATAG AACAACTAAC CCAGGAAATG 
CAACGCCTAA ATCATGTTGT TGATTTACAA CAAATGAGTT ACAAAGTTTA TCAAGCTTTG 
TACCAAAATG AAGATGAGAC TCCTACTGCT GCTGATTTAT TGGGAGATTG TGAAACAATA 
TTAAATCATA TTGTTGAGTT TGATTCCCGA ATGGAATCTA TGTTGGAATT GGTGCGAGAT 
GCGGTAGCAG CAGTAATGGA AGTGGGAAGA CAAATTAGCA TTTACGGAGA AAGTTTAGAA 
GCTGATCCGC AGCGGTTAGA GGAAGTAGAA GAACGGATTC GGGAACTAAA ACAAATTTGT 
CGCAAATATG GACCGACTCT TACGGAAGCG ATCACTTATT TTGAACGCAT CCAAATAGAG 
TTAGCAGAAC TCAATAATAA TGAACAATCA ATTGAAACTT TAGAACAACA AGAACAGGTT 
TGTTTACAAT ATCTCAATCA AGTCAACCAA CAATTGACCC AACTGCGTCG TAAAACTGCG 
GCTAATTTAG AATCTCATTT ATTGACTGAA CTTAAACCTT TAGGGATGGA AAAGGTAAAA 
TTTCAAGTGA AAATTGCCCC TAGTTCCCCA ACAGCAATGG GTGCAGATAA AATTACCTTT 
ATGTTTAGCC CTAACCCTGG TGAACCAATA CAACCTTTAA CAGAAATTGC TTCTGGTGGG 
GAAATGAGCC GATTTTTACT AGCTTTAAAA GCTTGTTTTA ATCAACATGA CGGTGCGGAA 
ACAATGGTAT TTGATGAAAT TGATGTGGGT GTGTCTGGAA GAATTGCCCA AGCTATTGCT 
GAGAAATTAC ACCAACTTAG TCAAAATCAA CAAGTATTAT GTGTGACTCA TCAACCCTTA 
GTAGCAGCAA TGGCAGATCG ACATTTTCGG GTGGATAAAC AAGTGATTAA TAAAAATGGT 
AATGCTGAAC AGCGGACAGT TGTGAGAGTT ACCAGCTTGG ATAATTTAAG TACCCGTCGG 
GAAGAATTAG CACAGTTAGC CGGTGGTAAA TCTGCAAATC AAGCGATGGC ATTTGCTGAA 
TCTTTATTAT TACAAGCAGC TAACCACCGT CGTCAAGAAC AAAGTTAA

Protein sequence

MLLCLRIENF ALIDQLELDF GAGLNVLTGE TGAGKSIILD AIDGVLGGKV SSRVIRTGTS 
RALVEGTFSI NPFLAAWLSE QEIDLIDDNA VVISREIAAT ASNIRSRSRV NGVLVNRQIM 
GSLRDRLVEI TAQGQTVQVG QSAQVRDWLD VYGGDSLIQQ RQKVAVAFSA YQQAHQTSEK 
RRTSERERLQ QFDLITYQVQ ELSAANLNYP QEIEQLTQEM QRLNHVVDLQ QMSYKVYQAL 
YQNEDETPTA ADLLGDCETI LNHIVEFDSR MESMLELVRD AVAAVMEVGR QISIYGESLE 
ADPQRLEEVE ERIRELKQIC RKYGPTLTEA ITYFERIQIE LAELNNNEQS IETLEQQEQV 
CLQYLNQVNQ QLTQLRRKTA ANLESHLLTE LKPLGMEKVK FQVKIAPSSP TAMGADKITF 
MFSPNPGEPI QPLTEIASGG EMSRFLLALK ACFNQHDGAE TMVFDEIDVG VSGRIAQAIA 
EKLHQLSQNQ QVLCVTHQPL VAAMADRHFR VDKQVINKNG NAEQRTVVRV TSLDNLSTRR 
EELAQLAGGK SANQAMAFAE SLLLQAANHR RQEQS