Gene Aazo_1836 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1836
Symbol
ID	9339629
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	1904695
End bp	1906263
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	37%
IMG OID
Product	secretion protein HlyD family protein
Protein accession	YP_003721062
Protein GI	298490885
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.161085
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCAAC TTAATGCTAA CCAAATCAAT AGCAACGGCA ATGGAAAAAA TCAAAGTCTA 
CAGTTGCTGA CACCTCGCAA AAAAGCTAAA ATAGCATCCT TAACTAATGC CTATAAGCAG 
GATGAATTTG AACAGTCTAT AGTCTTATGT CAATCACCAA TATGGTCACG TACCATCATG 
ATTACCTTGA TGGTTGTAGC CTGTTTTGGA GTTGGGTGGG CTTATTTTTC CAAACTTGAA 
CAAGTAGTTC CAGCAACAGG TCAATTAAAA CCAGAGGGAA CAGTCAAAGA AGTACAAGCT 
CCCATTAATG GAGTTGTAAA ATCTGTTTAT GTAAAAGATG GTCAAACCGT AAAAAAAGGA 
GACTTGATCT TAACATTTGA ATCGGTTGCA ACTTTAGCTG AGTTAAGTTC CTTAAATAAA 
ATTCGCGTTG CTTTAACTAA AGAAAACGAT ATTTATCGTC GCTTGATGGG AGCAAGCACA 
GGTATCACCT CAGAGTTGGA CTTTTTACGT AGTAACTTGT CACCAGAATC TGCTTTTCTC 
CTTAAACATC GAGCATCATT AGTAACAGAA AATGAACTAC TGCGTTCTCA ATTAAAGAAT 
ACTCCACCAG AAAATAGCAA CGGAATTGAT GAACAACAAC GCCTCATAGC AGCGAAGAGG 
GAATTAGATT CCCGATCTAG CGCAGCTAAA TTAGAAGTTG AAAAAATCAG GAAGCAACTA 
TCACAAACCA TCGTCAAAAT AAGAAATACT CAAGATAGTT TAGCCATTCA AACACAGATT 
TTGGATAAAC TCAAAATATT AGCAGTCGAA GGTGGAATTT CTCAACTGCA ATATCTCAAT 
CAGCAACAAC AAGTACAAAC TTTAAAAGCA GAAATATCAC AATTAACTGA GGAAGAAAAA 
CGCCTCCAGC TTGATATTCA AAAAGGACAG CAGGAAGTAA CTAATACAGT AGCAGTTACT 
GATAAAAACG TTCTGGAGCA GATAGCTAAC AACAAAAAGA GGATTGCCGA AATAGACAGC 
CAATTTATGA AGATTATTCT GGATAATGAG CAGAAATTGG GAGATATTAA CAGTAAGATT 
TCCCAGACGC AATTAAATGT TAGATATCAA GAGGTCCGTG CTCCTATAGA AGGGACAGTG 
TTCGATATGC AAGCCAAAAA TCCTGGGTTT GTAGCAAACA CCACCCAAAA ATTATTGCAA 
ATTGTACCTA ATGATAAATA TGTTGCTGAA GTATTTATCA CCAATAAAGA TATTGGATTT 
GTAAGGGTAG GTATGAACGT AGATGTGAGA ATTGATTCCT TTCCTTTTAG CGAATTTGGA 
GATATTAAAG GTCAGGTGAT TGATATCGGT TCAGATGCTT TACCCCCAGA TCAAATTCAT 
CAATTTTATA GATTTCCAGC CAGAGTTAGC TTGCATAAAC AAAAACTAGA AACTCAAGGC 
AAAAAGATAG CATTACAGTC TGGGATGTCA ATTACCGGTA ATATTAAAGT TCGCGAGGAA 
CGTACTGTAC TTAGTTTGTT CACGCAGATG TTTACCAAGC AAGTGGAGAG CTTGAACGAA 
GTGCGTTAA

Protein sequence

MTQLNANQIN SNGNGKNQSL QLLTPRKKAK IASLTNAYKQ DEFEQSIVLC QSPIWSRTIM 
ITLMVVACFG VGWAYFSKLE QVVPATGQLK PEGTVKEVQA PINGVVKSVY VKDGQTVKKG 
DLILTFESVA TLAELSSLNK IRVALTKEND IYRRLMGAST GITSELDFLR SNLSPESAFL 
LKHRASLVTE NELLRSQLKN TPPENSNGID EQQRLIAAKR ELDSRSSAAK LEVEKIRKQL 
SQTIVKIRNT QDSLAIQTQI LDKLKILAVE GGISQLQYLN QQQQVQTLKA EISQLTEEEK 
RLQLDIQKGQ QEVTNTVAVT DKNVLEQIAN NKKRIAEIDS QFMKIILDNE QKLGDINSKI 
SQTQLNVRYQ EVRAPIEGTV FDMQAKNPGF VANTTQKLLQ IVPNDKYVAE VFITNKDIGF 
VRVGMNVDVR IDSFPFSEFG DIKGQVIDIG SDALPPDQIH QFYRFPARVS LHKQKLETQG 
KKIALQSGMS ITGNIKVREE RTVLSLFTQM FTKQVESLNE VR