Gene Aazo_5105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_5105
Symbol
ID	9342913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	5236794
End bp	5238290
Gene Length	1497 bp
Protein Length	498 aa
Translation table	11
GC content	37%
IMG OID
Product	secretion protein HlyD family protein
Protein accession	YP_003723308
Protein GI	298493131
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATATT CCCTCGCTGC AAATGCTGTT CAAGCACGTC AAACAAAAGA GAGATTCGCA 
AAACCAGAGG AACAATTATC TTATGAATTA GGTAAAGCTG TACAGGAATT ACCACCGCTA 
TATGCAAGAT TATTAGCGGG AACAATTAGC GTGATTATAT TTGGCACAAT TTCCTGGGCG 
CATTTTTCAG AAATTGATGA AGTAGCGACA GCACCAGGAG AATTAATTGC TTCTACTCAA 
GTTAGACCAG TGACATCTTT GGGTAGTGGA TATATTTTAG CAGTGAAAGT CAAAGAGGGC 
GATCACGTTA CCAAAGATCA AATTTTAATA GAACGTGACC CCAACTTACA ACAAACCGAT 
GTTAACCGAC TGGCTAAAGC TATTAAATTA ATTGAGGATG ACTTGCAGCG TTTAGAAGCA 
GAACGTATCC GCGAAAAAAC TGCCGGAACA AAACTGCAAG ACGAACTTTT AAATTCTCGT 
TTATTAGACT ACAAAGCCAA ACAAGCAGCA GCAGAAGCAG AAGCACAACG CCAACTTTCA 
ATTATCAATC AAGCAAAAGT TCGTTTAAGT CGCTTACAAG AAAATTTAGC CAACGCCCAA 
ACCAGCTTTA CTAATGCTCA AACTAACCTA GTGAATGCTG AAGGCATCCG TGCTAAAGTT 
GATAATAATT TAACCATAGC TCAAAAAAGA GAAGAAAATC TCCGCGCTTT ATTAAATCCC 
GGTGCAGTTC CCAGAGTTGA TTATTTAGAA GCACAGGAAA GATTAAATCG TGCCAGTACA 
GACATTATTA AAAGCTCAGA TGAAGTAACT AATACCAAAA ATAGACTGAC AGAAGCAAAA 
GATAAAGTTA GATCTTTAGA AAAAGATATT GCTGCTCAAG ACCAAGAAAT TCGCCAAGCA 
GAACAAGCTT ATCAAGCAGC ACGTAATCAA GGCTTACGTT TAGCATCAGA ACGCCAAAGT 
GAAATTTTAA CCCAAATCAA TAAACGCAAA GAAGAATTAA CTAATGTTGC GGGTCAATTA 
GAACAAGCAA AAATGCAGAA AGATAGGGAA ACTATTAAAG CACCTGTCGC GGGAACAATT 
TACAAAATTA AAGCTACTAA AGGTCCCATT CAATCTGGTG AAGAATTGCT ATCAATTGCA 
CCAGAAGGTG AAGAAATGCT TTTAGAAGTA AAAGTTCTTA ACCGCGATAT TGGCTTTATT 
CGTCAGAATA TGAAAGCAAA AGTTAAATTA GAAGCTTTTC CTTTTCAAGA ATTTGGAGTT 
GTTGATGGTG AGGTTTTACA AATTAGTCCC AATGCAGTAG TTGATAAAGA CTTGGGTTTA 
GTTTTCTCAA CCAGAATTAA ATTGACTCAA CATTCAATGA ATCTCCGAGG ACAAGAAGTG 
GAATTTACTC CAGGAATGGC TGCGAATGCA GAGATTATCA CTCGTGAGAA ATCAATTCTG 
ACCTTCATAG TTGAGCCAAT TACCCGCAGG TTTAGTGATG CTTTTTCTGT TAGATAA

Protein sequence

MKYSLAANAV QARQTKERFA KPEEQLSYEL GKAVQELPPL YARLLAGTIS VIIFGTISWA 
HFSEIDEVAT APGELIASTQ VRPVTSLGSG YILAVKVKEG DHVTKDQILI ERDPNLQQTD 
VNRLAKAIKL IEDDLQRLEA ERIREKTAGT KLQDELLNSR LLDYKAKQAA AEAEAQRQLS 
IINQAKVRLS RLQENLANAQ TSFTNAQTNL VNAEGIRAKV DNNLTIAQKR EENLRALLNP 
GAVPRVDYLE AQERLNRAST DIIKSSDEVT NTKNRLTEAK DKVRSLEKDI AAQDQEIRQA 
EQAYQAARNQ GLRLASERQS EILTQINKRK EELTNVAGQL EQAKMQKDRE TIKAPVAGTI 
YKIKATKGPI QSGEELLSIA PEGEEMLLEV KVLNRDIGFI RQNMKAKVKL EAFPFQEFGV 
VDGEVLQISP NAVVDKDLGL VFSTRIKLTQ HSMNLRGQEV EFTPGMAANA EIITREKSIL 
TFIVEPITRR FSDAFSVR