Gene Aazo_1358 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1358
Symbol
ID	9339153
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	1430633
End bp	1432072
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	42%
IMG OID
Product	nitrogenase cofactor biosynthesis protein NifB
Protein accession	YP_003720737
Protein GI	298490560
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACTAC CGGCCACAGG ACTCCTCACC TCCTCCGAAC AGGAACTCAA TATCAAGCAA 
GCCAAATCAG GTGGTTGTGG TTGCGACAGC AGCACAGCTC TAGAAATGGA CGAAAAGGTC 
AAAGAACGCA TTGCCAAACA CCCTTGCTAT AGTGAAGAAG CACATCACCA TTATGCACGG 
ATGCACGTTG CAGTTGCACC AGCTTGTAAT ATTCAATGCA ACTATTGTAA CCGCAAGTAT 
GACTGTGCTA ACGAAAGCCG ACCTGGAGTA GTGAGTGAGT TACTCACACC TGAAGAAGCC 
GCACATAAAG TGTTGGTAAT TGCAGGTAAA ATTCCCCAAA TGACAGTGTT GGGAGTTGCA 
GGTCCTGGTG ATCCTTTAGC AAATCCTGAA AAAACATTCC GTACCTTTGA GTTGATTGCA 
GATAAAGCAC CAGATATTAA GCTTTGCTTA TCAACTAACG GTTTGATGCT ACCAGAATAT 
ATTGATCGCA TCAAACAATT AAATATAGAT CACGTTACTA TAACCCTTAA CACCATTGAT 
CCAGAAATCG GCGCACAAAT TTATGCTTGG GTTCATTACA AACGCAAGCG TTATAAAGGT 
GTGGAAGGTG CAAAGATTCT GCTAGAAAAG CAGTTGGAAG GATTGCAAGC TTTAAAAGAA 
GCCGACATTT TGTGTAAAGT TAATTCTGTG ATGATTCCCG GAATTAATGA TCATCACTTG 
GTGGAAGTTA ACAAAATGAT TCGTGAGAAT GGTGCATTCT TACACAATAT CATGCCGCTA 
ATTTCCGCAC CAGAACATGG GACACATTTC GGTTTAACTC ATCAACGTGG TCCAACAGGA 
AAAGAACTCA AAGAAGTTCA AGATAACTGT TCTGGTAACA TGAAAATGAT GCGTCACTGT 
CGCCAGTGCC GAGCAGATGC GGTAGGATTA TTAGGAGAAG ACCGCAGTCA GGAATTTACC 
AAAGAGAAAT TCTTGGAAAT GTCTCCAGAA TATAACCTGG AAACACGCCA GGAAGTTCAT 
CAGGGCATTG AGAAATTTAG AGAAGCAATT AAACTAGCAA AGGCCAAGGT ACAAACTGCT 
AAGGAAGTTG CCAACAGTCC GAAAATTTTA GTGGCTGTAG CGACTAAAGG TGGTGGATTA 
GTTAATCAAC ACTTCGGTCA TGTGAAGGAA TTTCAAGTGT ACGAAGTTGA TGGTAATGAA 
GTGCACTTTA TCAGTCATCG CAAAATCGAC CAATATTGTC AAGGTGGATA CGGCGAAGAA 
GCGACCGCAG AAAATATAAT GAAAGCGATT GCAGATTGTA AAGCAGTCTT AGTTGCCAAA 
ATTGGTAACT GTCCCAAAGA GAAATTAGAA GCAGCAGGGA TAAAGACTGT GGAAGCTTAC 
GACGTAATTG AAAAAGTCGC ACTTGAATTT TACCAGCAGT ATGTAGGGAC TGGGGACTAG

Protein sequence

MTLPATGLLT SSEQELNIKQ AKSGGCGCDS STALEMDEKV KERIAKHPCY SEEAHHHYAR 
MHVAVAPACN IQCNYCNRKY DCANESRPGV VSELLTPEEA AHKVLVIAGK IPQMTVLGVA 
GPGDPLANPE KTFRTFELIA DKAPDIKLCL STNGLMLPEY IDRIKQLNID HVTITLNTID 
PEIGAQIYAW VHYKRKRYKG VEGAKILLEK QLEGLQALKE ADILCKVNSV MIPGINDHHL 
VEVNKMIREN GAFLHNIMPL ISAPEHGTHF GLTHQRGPTG KELKEVQDNC SGNMKMMRHC 
RQCRADAVGL LGEDRSQEFT KEKFLEMSPE YNLETRQEVH QGIEKFREAI KLAKAKVQTA 
KEVANSPKIL VAVATKGGGL VNQHFGHVKE FQVYEVDGNE VHFISHRKID QYCQGGYGEE 
ATAENIMKAI ADCKAVLVAK IGNCPKEKLE AAGIKTVEAY DVIEKVALEF YQQYVGTGD