Gene Aazo_4141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4141
Symbol
ID	9341946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	4212926
End bp	4214599
Gene Length	1674 bp
Protein Length	557 aa
Translation table	11
GC content	40%
IMG OID
Product	Ppx/GppA phosphatase
Protein accession	YP_003722700
Protein GI	298492523
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTGAATG CAGTTTCAGC TAACTGGGAG AGTACACCTA CTCAACCAGT CAAGCAAAAC 
CCGATTATTG CGGCTATTGA TATCGGTACT AATTCCTTAC ATATCGTCAT AGTAAGAATT 
GAACCGACGC TACCAGCTTT TACGATGATC GCCAGAGAAA AAGAAACGGT AAGATTAGGC 
GAGCGCAACT TGGAAACTGG AGAACTCAAA CCAGAAGTGA TCAGAAAAGC GATCGCTTGT 
TTGGGACGTT TCCAAAAACT TGCTAAAAGC CTAGAAGCAG AAAGCATTAT TGCAGTAGCA 
ACCAGCGCCG TCCGCGAAGC CCCTAATGGG CAGGATTTTT TACAGAACAT AGAAAGCGAA 
ATAGGCTTAA GCGTAGACTT GATTTCTGGT CAAGAAGAAG CCCGACGCAT CTATTTAGGT 
GTTTTATCAG GGATGGAATT TAATCACGAA CCACACATCA TTATTGACAT TGGTGGTGGT 
TCCACAGAAT TAATTTTAGG TGACTCTCAA GACCCCCGCA GCCTTACCAG CACGAAAGTA 
GGTGCAGTGC GACTAACTGG AGAGTTAATT AACACCGACC CAATCAGCCA TTGTGAGTTT 
CAATACTTAC AAGCTTATGC AAAAGGGATG TTAGAACGTT CTGTAGAAGA TGTACTTTTT 
AAACTCAAAC CTGGTGAATC TCCCAAATTG GTGGGAACAT CAGGCACCAT TGAAACCTTA 
GCAACTATTC ATGCTAAAGA AAAAATGGGT GTTGTTCCTT CTACTCTCAA CGGTTATCAA 
TTTAGTCTTC AAGACTTGCG GACTTGGGTA ACTCGCTTAC GACGGATGAC CAATGTAGAA 
AGGGCTGCAA TTTCAGGAAT GCCAGAAAAG CGGTCAGAAG TGATACTAGC TGGGGCGGTG 
ATATTACAGG AAGCCATGAC CCTGTTAGAT GTGGATTCAG TTTCACTCTG TGAACGATCT 
CTGCGAGAAG GTGTAATTGT CGATTGGATG CTGACACATG GTTTTATTGA CAACAAACTA 
CGCTATCAAA GTTCGATTAG AGAACGTAAT GTTCTAAAAA TTGCTAAGAA ATACCATATT 
AACTTAGAAA ATAGCAATGC TTGTGGCGAC CATAGCGATC ACATAGCTAA ATTTGCATTG 
AGTTTATTTG ATCAAACTCA AAGTCAACTA CATAATTGGG GTCAACAAGA AAGACAATTG 
CTTTGGGCTG CTGCCATTTT ACACAATTGT GGTCACTACA TCAGCCATTC TTCACACCAC 
AAGCATTCAT ACTATTTGAT TAGAAATGGT GAATTACTTG GTTATAACGA AACTGAAATA 
GAAATCATAG CTAATTTAGC CCGTTATCAC CGCAAATCAC CCCCTAAGAA AAAACACGAT 
AACTACCGTA ATTTATTGCA TAAAGAACAT CGGCTCATAG TTTCTCAACT GAGTGCAATT 
TTAAGATTGT CAGTAGCCTT AGATAGAAGA CAAATCGGTG CTATCTCTCA AGTGCAGTGT 
GAATATATTC CCCAGAAACA TGAATTTAAA ATCTTGTTAT TCCCCAGAAT TTTAGGTGAT 
GATTGTGCTT TAGAACTGTG GAGTTTAGAT TATAAGAAAG GTGTGTTTGA AGAAGAATTT 
GGTTTAAAAT TAGACGCAAA TTTAGTTAAT ACTTGCAGCG TGAATTTTCC TTAG

Protein sequence

MLNAVSANWE STPTQPVKQN PIIAAIDIGT NSLHIVIVRI EPTLPAFTMI AREKETVRLG 
ERNLETGELK PEVIRKAIAC LGRFQKLAKS LEAESIIAVA TSAVREAPNG QDFLQNIESE 
IGLSVDLISG QEEARRIYLG VLSGMEFNHE PHIIIDIGGG STELILGDSQ DPRSLTSTKV 
GAVRLTGELI NTDPISHCEF QYLQAYAKGM LERSVEDVLF KLKPGESPKL VGTSGTIETL 
ATIHAKEKMG VVPSTLNGYQ FSLQDLRTWV TRLRRMTNVE RAAISGMPEK RSEVILAGAV 
ILQEAMTLLD VDSVSLCERS LREGVIVDWM LTHGFIDNKL RYQSSIRERN VLKIAKKYHI 
NLENSNACGD HSDHIAKFAL SLFDQTQSQL HNWGQQERQL LWAAAILHNC GHYISHSSHH 
KHSYYLIRNG ELLGYNETEI EIIANLARYH RKSPPKKKHD NYRNLLHKEH RLIVSQLSAI 
LRLSVALDRR QIGAISQVQC EYIPQKHEFK ILLFPRILGD DCALELWSLD YKKGVFEEEF 
GLKLDANLVN TCSVNFP