Gene Franean1_6879 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6879
Symbol
ID	5675192
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8382943
End bp	8384499
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	68%
IMG OID	641245728
Product	nitrogenase molybdenum-iron protein beta chain
Protein accession	YP_001511119
Protein GI	158318611
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01286] nitrogenase molybdenum-iron protein beta chain

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.640197
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.320804
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGACGA CTCCCGAGAC AGGCAGTTCC ATTCCGTTGC GGGTCCTCGA CCACAGCGAG 
CTGTTCAAGG ACGAGGTCTA CCAGAAGCAG TTCGAGGGAA AGACCGAGTT CGAGAACGGC 
AGTGACTCCG CCGAGGTTGC CCGCGTCCTC GAGTGGACCC GCGGCTGGGA GTACCGGGAG 
AAGAACTTCG CCCGGGAGGC GCTGACCGTC AACCCGGCGA AGGCCTGCCA GCCGCTCGGT 
GCGGTGCTCG CGGGCCTCGG GTTCCAGGGC ACGCTGCCGC TCGTGCACGG TTCGCAGGGC 
TGCGTCGCGT ACTTCCGCAG CCACTTCGCT CGGCACTTCA AGGAGCCCGT CCCCGCGGCA 
TCCACGTCGA TGACCGAGGA CGCGGCGGTC TTCGGCGGCC TGAACAACCT GGTCGAGGCG 
CTGGAGAACG CGACCAGCCT GTACAAGCCG AAGATGGTCG CGGTCAGCAC CACCTGCATG 
GCCGAGGTCA TCGGTGAGGA CCTCTTCGCC TACATCGGCG CGGCCAAGGA GAAGGAGGTG 
ATCTCCACCG ACTACCCGGT TCCCTACGCC CACACCCCGA GCTTCGTGGG CTCGCACATC 
ACCGGGTACG ACAGCATGCT CAAGGGAATC CTTGAGAACC TGACGAAGTC GGCGGACGCG 
ACGGAGCCGA AGGCTGGTGG GAAGCCCCGG CTGAACATCA TCCCCGGTTT CGAGACCTAC 
ACCGGTAACC TCCGCGAGTA CCGGCGCGTG CTCGAGCTCA TGGGCGTGGA CCCGCTGATC 
CTCGGCGACC ACGCCGACTC GCTCGACTCG CCGGCCGACG GGGAGTACGA CCTCTACCCC 
GGTGGCACGC CGCTGGCCGA GGCGGCGAAG GCGAAGTTCA GCCGCGCCAC CGTGCTGCTG 
CAGGAGTCCG CCACCCGCAA GACCACCGAG CTGATCCGGG ACGTGTGGAA GCAGGACACG 
CTGGTGCTGG AGACCCCGAT CGGGGTCCGC GGCACCGACC AGTTCCTGAC CGAGATCGCC 
CGGCTGGCGG GCGTCGAGAT CCCGGCCGAG CTCACCGTCG AGCGCGGCCG TCTCGTTGAC 
GCCCTGACGG ACTCGCACGC CTACCTCCAC GGCAAGAGGG TCGCCATCGC CGGCGACCCG 
GACCTCGTCG TGGCGCTGAC CCGCTTCGTG CTCGAGCTCG GCATGATCCC GGTGCACGTG 
CTCAGCACGA ACGCCGACAC CACCTTCAAG GCCCGCATGG AGAAGGTGCT CTCGGCGAGC 
AAGTTCGGCG AGGCGGCCAC CGTCTGGCCG GAGAAGGACC TGTGGCACCT GCGGTCGCTG 
GTCTTCACCG AGCCGGTCGA CCTGCTCATC GGCAGCACCT ACCTGAAGTA CATCTCCCGG 
GAGGCGAACG TTCCGCTGGT GCGGGTCGGG TTCCCGATCT TCGACCGGCA CCACCTGCAC 
CGCTTCCCGA TCGTCGGTTA CACCGGCGGG CTGCACCTGC TCACGCAGCT CGTGAACACC 
GTGCTGGACG AGCTTGACCG GACCAGCCCG GACCATAGCT ACGACGCCGT GCGCTAG

Protein sequence

MTTTPETGSS IPLRVLDHSE LFKDEVYQKQ FEGKTEFENG SDSAEVARVL EWTRGWEYRE 
KNFAREALTV NPAKACQPLG AVLAGLGFQG TLPLVHGSQG CVAYFRSHFA RHFKEPVPAA 
STSMTEDAAV FGGLNNLVEA LENATSLYKP KMVAVSTTCM AEVIGEDLFA YIGAAKEKEV 
ISTDYPVPYA HTPSFVGSHI TGYDSMLKGI LENLTKSADA TEPKAGGKPR LNIIPGFETY 
TGNLREYRRV LELMGVDPLI LGDHADSLDS PADGEYDLYP GGTPLAEAAK AKFSRATVLL 
QESATRKTTE LIRDVWKQDT LVLETPIGVR GTDQFLTEIA RLAGVEIPAE LTVERGRLVD 
ALTDSHAYLH GKRVAIAGDP DLVVALTRFV LELGMIPVHV LSTNADTTFK ARMEKVLSAS 
KFGEAATVWP EKDLWHLRSL VFTEPVDLLI GSTYLKYISR EANVPLVRVG FPIFDRHHLH 
RFPIVGYTGG LHLLTQLVNT VLDELDRTSP DHSYDAVR