Gene Aazo_3874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_3874
Symbol
ID	9341678
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	+
Start bp	3927270
End bp	3928436
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	39%
IMG OID
Product	NHL repeat containing protein
Protein accession	YP_003722506
Protein GI	298492329
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTAAATC ATCTGACTCA AGATATAGAC CCTTTATCCA TATTTCCCAA CGGTGCAAAA 
ATAATATTAG GAAACAATAT TACATCCGAA CAAATAGCCA TACCTCTTGC ACCAAGTCCA 
ACAACAATGT TTGGACCCCG TGCTGCTTGT TTATTATCAC CAACTGGACC ATTATGGGTA 
TCAGATACAG GACATCATCG TTTATTAGGT TGGCGAAATT TACCCACAGA AGATAATCAA 
CCGGCTGATT GGGTAATAGG ACAACCTGAC TTTTATCATG AAGGACAAAA CGCCAAAGGT 
ACACCTGGAA AATCTACAGT TAGTGTCCCT ACAAGTATTT GTAAATGTGG TGCAGGTTTA 
GCTGTTGCTG ATGCTTGGAA TCATCGGGTC TTAATTTGGC ATAATGTACC GGAAGATAGC 
AATTTTCCCG CAGATTTAGT ATTAGGACAA GCTAATTTTA CCGATAACGA ACATAACCAA 
GGTAGTCAAC AACCTGCGGC AAATACTTTA CATTGGCCCT ATGGTGTTTT CTATCATCAA 
GGTAAGTTAT TTGTAGCCGA TACTGGAAAT CGCCGTTTGT TAATTTGGAA TCAATTTCCT 
ACAGAAAATG GACAACCAGC GGATATAGTT TTGGGACAAC CAGACATGAT ATTTCGTAAT 
GAAAATGGTG GTGGTTCTCC CACTGCTTCT AGTATGCGCT GGTGTCATGA TATTACTCTT 
TGGGATAATA ATTTAGTTGT CACCGATGCG GGTAATAACC GGGTGATGAT TTGGGATGGT 
ATACCGACAG AAAATAATGC CCCTTGTGCG GTGGTCTTAG GTCAGAAAAA CTTCAATTTT 
GTGGAATTAA ATCAAGGTGT ATATTTTCCT ACTGGCAGTA GCCTAAGTAT GCCTTATGGG 
GTAGATACTG CGGGAGATTG GTTAATAGTT GCAGATACGG CTAATTCTCG TTTGCTAGGA 
TGGAAGAAAC GAGAATCTAT TTTGTTATTA CAGGGTGGAT ATGCTGATGG TGTAGTGGGA 
CAAGATAGTT TTAAAAGTAA GAGTGAAAAT CAGAATTTTG GACCGCCAAC GCGACGAAGT 
TTAAATTGGT GCTATGGAAT TAAAGTTTGT GGTGAAATTG CGGTAATTTC TGATTCTGGC 
AATAATCGAG TTTTGATTTG GAGATGA

Protein sequence

MLNHLTQDID PLSIFPNGAK IILGNNITSE QIAIPLAPSP TTMFGPRAAC LLSPTGPLWV 
SDTGHHRLLG WRNLPTEDNQ PADWVIGQPD FYHEGQNAKG TPGKSTVSVP TSICKCGAGL 
AVADAWNHRV LIWHNVPEDS NFPADLVLGQ ANFTDNEHNQ GSQQPAANTL HWPYGVFYHQ 
GKLFVADTGN RRLLIWNQFP TENGQPADIV LGQPDMIFRN ENGGGSPTAS SMRWCHDITL 
WDNNLVVTDA GNNRVMIWDG IPTENNAPCA VVLGQKNFNF VELNQGVYFP TGSSLSMPYG 
VDTAGDWLIV ADTANSRLLG WKKRESILLL QGGYADGVVG QDSFKSKSEN QNFGPPTRRS 
LNWCYGIKVC GEIAVISDSG NNRVLIWR