Gene Aazo_1350 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Aazo_1350
Symbol
ID	9339145
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	'Nostoc azollae' 0708
Kingdom	Bacteria
Replicon accession	NC_014248
Strand	-
Start bp	1421282
End bp	1422649
Gene Length	1368 bp
Protein Length	455 aa
Translation table	11
GC content	38%
IMG OID
Product	nitrogenase MoFe cofactor biosynthesis protein NifE
Protein accession	YP_003720729
Protein GI	298490552
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.452769
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATTA CCCAAGGCAA AATTAACGAG TTACTTAGTG AATCAGGATG CAAAGATAAT 
CAACATAAAC AAGGAGAAAA GAAAAACAAA TCTTGTACAC AACAAGCTCA ACCAGGTGCT 
GCTCAAGGAG GATGCGCTTT TGATGGTGCA ATGATTGCAT TAGTACCTAT TACTGATGCT 
GCTCATTTGG TTCATGGACC TATTGCTTGT GCTGGTAACT CTTGGGGAAG TCGTGGAAGT 
CTTTCTTCTG GACCAATGCT CTATAAGACC GGTTTTACCA CTGATATTAG TGAAAATGAT 
GTAATTTTCG GTGGTGAGAA AAAGCTTTAT AAGGCAATTT TGGAAGTTAA TGAACGCTAC 
AAACCAGCCG CTATTTTTGT TTACGCTACT TGTGTAACTG CTTTAATCGG CGATGATATT 
GATGCAGTTT GTAAAGTTGC GGCTGAGAAA GTTGGTACTC CTGTCATTCC AGTAATTGCT 
CCGGGATTTA TTGGTAGTAA AAATCTAGGT AATCGTTTTG GTGGTGAAGC TTTACTAGAA 
TATGTAGTTG GCACTGCTGA ACCTGAATAT ACTACACCTT ATGATATTAA TTTGATTGGT 
GAATACAATA TTGCTGGTGA AATGTGGGGC GTTTTGCCTT TATTTGAAAA ATTAGGCATT 
CGCGTCTTAT CAAAAATCAC TGGTGATGCT CGTTATGAAG AAATTCGTTG TGCTCACCGC 
GCTAAGTTAA ATGTAATGAT TTGCTCACGG GCCTTATTAA ATATGGCGCG GAAAATGGAG 
GAACGTTACG GTATTCCTTA CATTGAAGAG TCTTTTTATG GTATTAATGA TATTAATCAT 
TGTCTCAGAA CTGTTGCAGC TAAATTAGGT AGTCTTAATT TACAAGCACG GACTGAAAAG 
TTAATTACAG ATGAAACAGC GGCTTTAGAT ATTGCCCTTG CTCCCTATAG AGAATCCTTA 
AGGGGTAAAC GGGTGGTTCT GTATACTGGT GGTGTGAAAA GTTGGTCGAT CATTTCTGCT 
TCTAAGGATT TAGGAATTGA AGTTGTTGCT ACTAGTACAC GCAAAAGTAC AGAAGAAGAT 
AAATCCAAAA TCAAGAAATT ACTTGGCAAT GATGGCATTA TGTTGGAAAA GGGTAATGCC 
CAAGAATTGC TAAAATTAGT AAGAGAAACT AAAGCTGATA TGTTAATAGC TGGTGGTCGG 
AATCAGTACA CAGCTTTAAA GGCAAGAATT CCATTTTTAG ATATTAACCA AGAACGTCAT 
CATCCCTATG CAGGTTATAT GGGAATGGTG GAAATGGCAC GGGAGTTATA TGAGGCTTTG 
TATAGTCCAA TTTGGGAACA AATTCGTAAG CCTGCGCCTT GGGAGTAA

Protein sequence

MKITQGKINE LLSESGCKDN QHKQGEKKNK SCTQQAQPGA AQGGCAFDGA MIALVPITDA 
AHLVHGPIAC AGNSWGSRGS LSSGPMLYKT GFTTDISEND VIFGGEKKLY KAILEVNERY 
KPAAIFVYAT CVTALIGDDI DAVCKVAAEK VGTPVIPVIA PGFIGSKNLG NRFGGEALLE 
YVVGTAEPEY TTPYDINLIG EYNIAGEMWG VLPLFEKLGI RVLSKITGDA RYEEIRCAHR 
AKLNVMICSR ALLNMARKME ERYGIPYIEE SFYGINDINH CLRTVAAKLG SLNLQARTEK 
LITDETAALD IALAPYRESL RGKRVVLYTG GVKSWSIISA SKDLGIEVVA TSTRKSTEED 
KSKIKKLLGN DGIMLEKGNA QELLKLVRET KADMLIAGGR NQYTALKARI PFLDINQERH 
HPYAGYMGMV EMARELYEAL YSPIWEQIRK PAPWE