Gene Aazo_4810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4810
Symbol
ID	9342617
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	4919032
End bp	4920372
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	41%
IMG OID
Product	hypothetical protein
Protein accession	YP_003723101
Protein GI	298492924
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGAAAT TACCTCATAA TCTGCCCACT TTGCCCGAAA TCATCAATGA TTTACCTAAT 
ATTTCTGGGT GGGAAACAGA AGTGCTGTCT GTAGTCAACC ATGATCAGGC TGTATTTTTA 
CCAACAACCA ATCTTAAATT AGCAGATATT GACGCTGTGT TTGCAATCGC TCTCCACATG 
CACCAGCCCA CTATACCAGC TGGACATAGC AGTTCACTCA TTAGCAACCT GCAATATATG 
TTTGAACATC AACACGAGGG AGACAACCAC AATGCAAAAC CTTTTGCCTA TTGTTACAGT 
CGCATGGGAG ACTTGATCCC CGAACTTGTA AATCAAGGTT GCAATCCCCG TGTCATGTTG 
GATTATTCTG GTAATCTTTT GTGGGGACTC CGACAAATGG GACGAAGTGA CATCCTCGAC 
AACCTCAAAC GGATTACTTG TGAGACCACC TATCAGCCTT ATGTAGAGTG GCTAGGGACA 
ATGTGGAGTC ACGCTGTAAT TCCTTCCACC CCCATAGCAG ATATGAAACT CCATATTATC 
GCTTGGCAAC ATCATTTTGC GGCAATTTTT GGATGGGAAG CACTAGGACG AGTCAAAGGA 
TTTTCACCCC CAGAAATGCA CCTACCAAAT CACCCAGATA TCCTATTTGG ATTTATCAAA 
GCCCTCAAAG AATCTGGATA TCTTTGGTTA TTAGTACAAG AACATACAAT AGAAACAATT 
ACTGGTGAAT CTATCACGCA AAAACATTTA CCACATCGTT TAGTTGCTCG CAATTCCCAA 
GGAGAAACAA TTAGTATTAC AACCTTAATT AAAACCCAAG GAGCAGATAC TAAATTAGTC 
GCTCAAATGC AACCATATTA TGAAGCTAAA ACCTTGTCTA AACAACAGTT AGCTTCTAAT 
TTAGTACCGC CAATCGTCAG CCAAATTGGT GATGGTGAAA ACGGCGGTGT AATGATGAAT 
GAATTTCCCA ACGGTTTTAA ACAAGCCTGG TGGGATATGG TGCAGCATGG CGGAGGTAAA 
ACCAGAGTAG TGGCTGTCTG TGGTACAGAA TATTTAGAAT TATTAGCAGA TGCTGGTTAT 
CTACCTGAAG ACTTTCCCCC TTGTCAACCA GTGGGACAAC ATCAGATCTG GCAACAAATT 
CCCGCAGATA ATTTTTCACC AAATGCTGTA GAAAATGCCA TACAAGGAAT TATAAAAACT 
AATCCTAATT TTCATGTAGA TGGCGCATTA TGGACTAATC ATATTAGTTG GGTGCAGGGA 
TACGAAAATG TTTTATCTCC CATGTATGAA TTAAGTAATT CATTTCATCG GCAGTTTGAT 
CACTTCTTAG CCAACAACTG A

Protein sequence

MLKLPHNLPT LPEIINDLPN ISGWETEVLS VVNHDQAVFL PTTNLKLADI DAVFAIALHM 
HQPTIPAGHS SSLISNLQYM FEHQHEGDNH NAKPFAYCYS RMGDLIPELV NQGCNPRVML 
DYSGNLLWGL RQMGRSDILD NLKRITCETT YQPYVEWLGT MWSHAVIPST PIADMKLHII 
AWQHHFAAIF GWEALGRVKG FSPPEMHLPN HPDILFGFIK ALKESGYLWL LVQEHTIETI 
TGESITQKHL PHRLVARNSQ GETISITTLI KTQGADTKLV AQMQPYYEAK TLSKQQLASN 
LVPPIVSQIG DGENGGVMMN EFPNGFKQAW WDMVQHGGGK TRVVAVCGTE YLELLADAGY 
LPEDFPPCQP VGQHQIWQQI PADNFSPNAV ENAIQGIIKT NPNFHVDGAL WTNHISWVQG 
YENVLSPMYE LSNSFHRQFD HFLANN