Gene Aazo_4567 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_4567
Symbol
ID	9342372
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	4655860
End bp	4657449
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	43%
IMG OID
Product	carbohydrate-selective porin OprB
Protein accession	YP_003722947
Protein GI	298492770
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.316045
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAT TCTGGGCATA TCTATTAGCA AGTCCGGCAA TTTGCGGTGC GATGCTTTCT 
ATGGGGACGG GTCCATCAGC CGGGGAAGTA ACAACGACAA CGGAAACTAG TGAACCAATT 
GGAATTACTA ATCTAACGCC AAAACTTGGA AAAATTAATC AACAGGAGTT GATATCACAA 
GTAACATCAG TATCTGAGTT ATCAGACGTG CAATCCACAG ATTGGGCATT TCAAGCTTTG 
CGATCTTTGG TAGAACGTTA CGGTTGTATT GCTGGCTATG CCAACGGTAC TTATCGTGGT 
AATCGTGCTA TGACAAGGTA TGAATTTGCA GCCGGGTTGA ATGCTTGTTT AGATCGAGTT 
AACGAATTAA TTGCCACTGC TACTGCTGAT CTAGTAACAA AACAGGATTT AGCCACACTG 
CAAAAACTAC GAGAAGAATT TGCGGCTGAA CTAGCAACCT TGCGGGGTCG TGTAGATGCG 
CTGGAAGCCA GGGCTGCTGA GTTAGAAGCC AATCAATTTT CTACCACCAG CAAATTGCAA 
GGGCAACTAG TCGCCGTCTT CAGTGAGGTT TTTGCTGGTA ACAGTGGTGA CAATAAAAAT 
AGCACTCTAG GCGCACGGGC GCGGATTGAA TTTGTCAGCA GCTTTAGTGG TCAAGATACG 
CTGTTTACCA GAATTGAGAG TAATAATATC AATAGCCCTA TCAGCAGTCC ACAACAGGGT 
AATTTGTTTT TTGCTGGTAG TGGTACTAAC GATACTTTCT TAGGTACACT GTGGTACAAA 
TTCCCAGTAG GTAACAAAAC ACAGGCAATA GCTATTGCTA CTGGCGGTGC AGCAGATGAC 
CTTACCAGCA CAATTAATAT TTTTGATGGT GATGGTGATG GTGCTTTGTC CACCTTTGGT 
ACACGCAACC CAATCTATAA CCAGATCAGT GGTGCAGGTT TGGGAGTAAA TCACCAGTTC 
AACAAGAATA TAACCTTAAG TTTAGGGTAT TTAGCAGGTA CTACCGACAA TCCTGCCTCA 
AACCCTGCCT CTAAAAATGG TTTGTTTGAT GGACCCTATG GTGCAATGGC ACAGTTGACC 
CTCAAACCAT GTGATCGCAT TGCCCTTGGT TTAATCTATA TCAATTCCTA CAATCAACCA 
ATACTCACAG GTAGCGAAGC TGCAACATCT GATATTAGCA GTGAAGCATT TTCCAGTAAT 
TCTTACGGTC TCCAAGCATC CGTTGCCATC AGTGAGAAAT TTGTATTGGG TGGTTGGGCT 
GGATATACCC GGAGTCAAGT GTTAACAAGA GAGAAAGGAG ATGTAGACAT TTGGAACTAT 
GCCGTTACCC TTGGTTTTCC AGACTTGGGT AAAAAAGGTA ACTTAGCTGG TATGATCCTG 
GGCATGGAAC CGAAAGTTAC GAGTTCTAGC ACCTCAGTGG TGTCTGAAGA CTTAGATACC 
TCATATCACA TTGAGGCATT TTATCAATAC AAAATTAGTG ACAATATCAC AATTACCCCT 
GGTGTTATTT GGATAACAGC ACCAGACCAT AATGATACTA ATAATAATGA TGTGGTAATT 
GGTGCTTTGA GAACCACCTT CAGTTTCTAA

Protein sequence

MQKFWAYLLA SPAICGAMLS MGTGPSAGEV TTTTETSEPI GITNLTPKLG KINQQELISQ 
VTSVSELSDV QSTDWAFQAL RSLVERYGCI AGYANGTYRG NRAMTRYEFA AGLNACLDRV 
NELIATATAD LVTKQDLATL QKLREEFAAE LATLRGRVDA LEARAAELEA NQFSTTSKLQ 
GQLVAVFSEV FAGNSGDNKN STLGARARIE FVSSFSGQDT LFTRIESNNI NSPISSPQQG 
NLFFAGSGTN DTFLGTLWYK FPVGNKTQAI AIATGGAADD LTSTINIFDG DGDGALSTFG 
TRNPIYNQIS GAGLGVNHQF NKNITLSLGY LAGTTDNPAS NPASKNGLFD GPYGAMAQLT 
LKPCDRIALG LIYINSYNQP ILTGSEAATS DISSEAFSSN SYGLQASVAI SEKFVLGGWA 
GYTRSQVLTR EKGDVDIWNY AVTLGFPDLG KKGNLAGMIL GMEPKVTSSS TSVVSEDLDT 
SYHIEAFYQY KISDNITITP GVIWITAPDH NDTNNNDVVI GALRTTFSF