Gene Bind_0474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_0474
Symbol
ID	6200670
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	534854
End bp	536314
Gene Length	1461 bp
Protein Length	486 aa
Translation table	11
GC content	56%
IMG OID	641704466
Product	nitrogenase molybdenum-iron protein alpha chain
Protein accession	YP_001831616
Protein GI	182677470
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01282] nitrogenase molybdenum-iron protein alpha chain [TIGR01862] nitrogenase component I, alpha chain

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.387575
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTAT CGGCACCCGA AACAATCGAA GAAATCAAGC AGAGGAACAA GGAACTCATC 
GCTGAGGTCC TGGAGGCCTA TCCCGAAAAG AGCAAGAAAA ACCGCGCCAA GCACCTCAAC 
CAGTTCCAGG AAGGTGGCAA GGATTGCTCG GTCAAGTCCA ACATCAAGTC CGTCCCGGGC 
GTGATGACGA TCCGTGGCTG CGCCTACGCC GGTTCGAAGG GCGTGGTGTG GGGTCCGATC 
AAGGACATGA TCCACATCAG CCATGGTCCG GTCGGCTGCG GCCAGTACTC CTGGGCTGCG 
CGTCGTAACT ATTACATTGG CACGACCGGT GTTGACACCT TCGTGACCAT GCAGTTCACC 
TCGGACTTCC AGGAAAAGGA CATTGTCTTC GGCGGCGACA AGAAGCTCGC GAAGATCATG 
GACGAAATCA TGGAATTGTT CCCCCTGAAC CATGGTGTCA CGGTTCAGTC GGAATGCCCG 
ATCGGCCTCA TCGGTGACGA CATCGAAGCC GTTTCGAAGC AGAAGTCCAA GGAATATGGC 
GGCAAGACCA TTGTTCCGGT CCGCTGCGAA GGCTTCCGTG GCGTTTCCCA GTCTCTCGGC 
CACCACATTG CGAACGACGC CGTTCGTGAC TGGGTGTTCG ACAAGATGGA AGGCAAGCCC 
GCCCGTATCG AACTCACCGA CTATGACGTT GCCATCATCG GCGACTACAA CATCGGTGGT 
GACGCTTGGT CGTCCCGTAT CCTTCTCGAG GAAATGGGCC TCCGCGTGAT CGCTCAGTGG 
TCGGGTGACG GTTCCATCGC CGAACTCGAG GCGACGCCGA AGGCGAAGCT CAACGTCCTT 
CACTGCTACC GCTCGATGAA CTACATCTCC CGCCACATGG AAGAAAAGTA CGGTGTTCCG 
TGGGTGGAAT ATAACTTCTT CGGCCCGTCC AAGATCGCTG AGTCGCTGCG CACGATCGCC 
AGCCACTTCG ACGACAAGAT CAAGGAAAAT GCCGAGAAGG TCATCGCCAA GTATCGCGCT 
CTGTCCGATG CGGTGATCGA GAAGTATCGT CCGCGTCTCC ATGGCCGTAA GGTCATGCTC 
TTCGTCGGCG GTCTGCGTCC GCGTCACGTT ATCGGCGCTT ACGAAGATCT CGGCATGGAA 
GTTGTCGGTA CCGGCTATGA GTTCGGCCAT AACGACGACT ATCAGCGCAC CACTCACTAT 
GTGAAGGACG GCACGCTGAT CTATGACGAC GTGACCGGCT ACGAGTTCGA GAAGTTCGTC 
GAAAAGATCC AGCCTGATCT GGTTGGTTCC GGCATTAAGG AAAAGTACGT CTTCCAGAAA 
ATGGGCGTTC CTTTCCGTCA GATGCATTCT TGGGACTATT CGGGCCCGTA TCATGGCTAT 
GATGGCTTCG CCATCTTCGC TCGCGATATG GACATGGCCA TCAATTCCCC GGTTTGGGGT 
TTGACCAAGG CTCCGTTCTA A

Protein sequence

MSLSAPETIE EIKQRNKELI AEVLEAYPEK SKKNRAKHLN QFQEGGKDCS VKSNIKSVPG 
VMTIRGCAYA GSKGVVWGPI KDMIHISHGP VGCGQYSWAA RRNYYIGTTG VDTFVTMQFT 
SDFQEKDIVF GGDKKLAKIM DEIMELFPLN HGVTVQSECP IGLIGDDIEA VSKQKSKEYG 
GKTIVPVRCE GFRGVSQSLG HHIANDAVRD WVFDKMEGKP ARIELTDYDV AIIGDYNIGG 
DAWSSRILLE EMGLRVIAQW SGDGSIAELE ATPKAKLNVL HCYRSMNYIS RHMEEKYGVP 
WVEYNFFGPS KIAESLRTIA SHFDDKIKEN AEKVIAKYRA LSDAVIEKYR PRLHGRKVML 
FVGGLRPRHV IGAYEDLGME VVGTGYEFGH NDDYQRTTHY VKDGTLIYDD VTGYEFEKFV 
EKIQPDLVGS GIKEKYVFQK MGVPFRQMHS WDYSGPYHGY DGFAIFARDM DMAINSPVWG 
LTKAPF