Gene Aazo_4565 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4565
Symbol
ID	9342370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	4653866
End bp	4655593
Gene Length	1728 bp
Protein Length	575 aa
Translation table	11
GC content	43%
IMG OID
Product	Fibronectin-binding A domain-containing protein
Protein accession	YP_003722945
Protein GI	298492768
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.871344
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCAACCAG TTGATTTTAC AACTCTCAAA GCTGCCTGTG GTGAACTACG GGCTAATTGG 
CTACCTGCGC GAACAGAACA GGTTTTCCAG CGCGATCGCT ATACTATTGC CATAGCCTTA 
CGGACTATGA AAAGGCGGGA TTGGCTAGAT ATTTCTTGGC ATCCCCAAGC TACACGCATT 
TGTATTGGTG AACCACCACC ACGCATACCA GACACATTCA CTTTTAGCCA ACAACTAATT 
CATCAGTTGG GTGGGTTGGC CTTAGTTGCT ATTGATTTTA TCGCCCCTTG GGAACGAGTG 
GTTGATTTAA AATTTGCCCG TCGTCCAGGA GAAGAAGCAC TTTATCACCT GTACGTCGAA 
GTAATGGGTA AATATAGTAA TGCTATTCTC ACAGATGCTA GAAATGAAAT TATCACCGCT 
GCGCATCAAG TTAGTCAGCA GCAATCTAGC GTCCGTCCCA TCCAAACCGG ACAGCCTTAT 
GAACCGCCAC CAAAACTTAC GGGAACTATT CCCAGTTTGG GGAAATCTCA AGCACGCTGG 
CAAGAAGGAG TCAGTTTGAT ACCGGGAGGG ATTAAACGAC AGTTACTGAA AAGTTATAGT 
GGTTTGAGTG CGGCTTTGTT AGATACGATG TTGCTGACTG CGAATATAGC AACAGATACA 
AGCACAGATG CTTTAACTGG TGATGATTGG GATAGACTAT TTGCGTGTTG GCAAAAATGG 
CTACAAACTT TAGAAACTGG TAAATTCCAA CCCGCTGGGA CTGAAAATGG CTATACGGTG 
ATGGGTTGGG CTGAAGTAGC ACCAGCCAAC AACATTCAAG AATTACTCAA CCAGTATTAC 
ACCGACCAGT TACGTCAACA GTTATTTTCC CAACTACGCC ATCAGTTAAG TCAGAAGTTA 
CAAAATATTC TGGGTAAGTT AGGCAGTAAG GCACAAACAT TTAAAGACAG ATTACAACAG 
TCAGATCAAG CGGATGAATA TCGGCAGAAA GCTGATTTGT TAATGGCGCA TCTGCAAAAC 
TGGCAACCGG GGATGAAGGA AATTATCCTG GCAGATTTTG AGACAAACCA ACCAATGGCG 
ATCGCACTTC AACCAGATAA AAACGCTGTC CAAAATGCCC AAAAACTTTA TAAACAACAT 
CAAAAACTTA AACGCGCCCG TGCTGCTGTC GAACCATTGC TGTGGGAAGT GCAAACAGAA 
ATTGACTATT TGGAACAAGT AGAAGCTGCA ATTTCCCAAA TTGATCAATA TCAAACAGCA 
GCAGATTTGC AAGCACTAGA AGAAATCCGT GATGAACTAA TTGGACAAAA ATATCTAGAA 
GCCTTAGAAT ATCGCAGCAG AAGCACAACC GATAGAGCAA GTACCAACTT TCATTGTTAC 
CGCACTCCCA GCGGCTTTGA AGTCTTAATT GGTCGGAACA ACAAGCAAAA TGATTATCTC 
ACATTTCGTG TCGCAGGAGA TTATGACTTG TGGTTTCACG CCCAAGAAAT CCCCGGGAGT 
CATGTTCTAC TACGTCTAGA ACCGGGTAAA GTTCCTGAAG AAACAGATTT ACAATTTACT 
GCCAATCTTG CTGCTTATTT TAGTCGTGCC CGTCAAAGTG ACCAAGTACC AGTAGTTTAC 
ACCCGATCCA ACCGGGTCTA CAAACCCAAA GGTACTAAAC CAGGGCTTGT GGTTTACAAG 
CAAGAAACTA TTATTTGGGG ACAACCGGGA ATAATTCGTA ATTCGTGA

Protein sequence

MQPVDFTTLK AACGELRANW LPARTEQVFQ RDRYTIAIAL RTMKRRDWLD ISWHPQATRI 
CIGEPPPRIP DTFTFSQQLI HQLGGLALVA IDFIAPWERV VDLKFARRPG EEALYHLYVE 
VMGKYSNAIL TDARNEIITA AHQVSQQQSS VRPIQTGQPY EPPPKLTGTI PSLGKSQARW 
QEGVSLIPGG IKRQLLKSYS GLSAALLDTM LLTANIATDT STDALTGDDW DRLFACWQKW 
LQTLETGKFQ PAGTENGYTV MGWAEVAPAN NIQELLNQYY TDQLRQQLFS QLRHQLSQKL 
QNILGKLGSK AQTFKDRLQQ SDQADEYRQK ADLLMAHLQN WQPGMKEIIL ADFETNQPMA 
IALQPDKNAV QNAQKLYKQH QKLKRARAAV EPLLWEVQTE IDYLEQVEAA ISQIDQYQTA 
ADLQALEEIR DELIGQKYLE ALEYRSRSTT DRASTNFHCY RTPSGFEVLI GRNNKQNDYL 
TFRVAGDYDL WFHAQEIPGS HVLLRLEPGK VPEETDLQFT ANLAAYFSRA RQSDQVPVVY 
TRSNRVYKPK GTKPGLVVYK QETIIWGQPG IIRNS