Gene Franean1_6877 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6877
Symbol
ID	5675190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8379773
End bp	8381242
Gene Length	1470 bp
Protein Length	489 aa
Translation table	11
GC content	74%
IMG OID	641245726
Product	nitrogenase molybdenum-cofactor biosynthesis protein NifN
Protein accession	YP_001511117
Protein GI	158318609
COG category	[C] Energy production and conversion
COG ID	[COG2710] Nitrogenase molybdenum-iron protein, alpha and beta chains
TIGRFAM ID	[TIGR01285] nitrogenase molybdenum-iron cofactor biosynthesis protein NifN

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.320804
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAGGG TCGTCACGAG TGACCGCCGG CCCGGCCTGG ACCCGCTGCG GTTCAGCCAG 
CCGCTCGGCG GGGCACTGGT CTTCCTCGGC CTCGCCGCGG CGATGCCCGT CATGCACGGG 
TCGAAGGGCT GCGCCTCGTT CGCCAAGGCG CTGCTGACCC GGCACTTCAA CGAGCCCGTC 
CCGCTGCAGA CCACCGGTGT CACCGAGGTG TCCGCGGTGC TCGGCAGTGG CGACGACCTC 
GTCGCCAACC TGGACGGCAT CCGCGCCAAG CAGAACCCGC GGATCATCGG GCTGCTGACC 
ACCGGCGTCA CCGAGGTCAG CGGCGAGGAC GTCGCCGGCC AGGTCCGCCA GTACATCGCG 
ATGATGAACC ACACCACCCC CGAGGGCGCG CCGCTGATCG TCCGGGTGTC CACGCCGGAC 
TTCGCCGGCG GGCTGTCGGA CGGCTGGTCG GCCGCGCTGC GCTCGCTGGT CGCCACCGTC 
CCCTTCGACC ACGCCGACTC GGACGAGTAC CCGGGTACGC GCTCGGGCTT CGGCGCCGGA 
ACCGGTTCCG CGCCCGAGAC GGTCGCCGTG CTCGTCGGCC CGTCCCTGTC GGCCGCCGAC 
CTCGACGAGC TCTGCGCGCT GATCCGTTCC TTCGGGATGG CGCCGGTGCT GGTCCCGGAT 
CTCTCCGGCT CCCTCGACGG GCACCTGGCC CCGTCCTGGC AGCCGACGAC GACCGGTGGC 
ACGGGGCTTG CGCAGCTGCG CCGCCTCGAC GAGGCCGGCC TGATCATCAC CGCCGGCGCG 
ACCGCCGCGG AGGCCGGCGT CGACCTGGCC GCGCGCACCG CCGCCGACCT CGTCCAGCAC 
GACCACCTCA GCGGCCTCGC CGCGGTGGAC AGCCTGGTCG CCGAGCTGAT GACCCGCTCG 
GGACGCGGAC CGGCGCCCGA GGTGCGGCGG GCCCGCGCCC GGCTGGCGGA CGGCCTGCTC 
GACACCCACT TCGTCCTCGG CGGGGCGCGG ATCGCGCTCG CGATGGAGCC CGAGGCGCTG 
GTCGCCGTCG GCTCCCTGCT GCACGACGTC GGCGCGGAGA TCGTCGCGGC GGTGTCGCCG 
ACGGACGCTC CCGTGCTCGC CACCGCCCCC TGGGACGAGA TCGTCATCGG CGACCTGACC 
GACCTGGAGG AACGCGCCCT CGAAGGCGGC GCGGAACTGC TCATCGGGTC GAGTCACGTC 
CGCACGGTCG CCGACCGTAT CGGCGCCGCC CACCTGGCCG TCGGATTCCC GATCTACGAC 
CGGCTCGGAT CGGCCCTGCG CACGACCGCC GGGTACGGGG GCAGCCTGCG GCTGCTCGTC 
GACGCGGCGA ACCGGCTGCT CGACCACCAC CAGGCGGACC ACCAGGCGAA CCACCGGGCC 
GATCACCGCC CGGGGCGCCA CGACGTCCGC GAACATCCGC TCGACTCGTT CGACCAGCTC 
GACGTTCTGT GCCAGGAGTC CCCATGTTGA

Protein sequence

MARVVTSDRR PGLDPLRFSQ PLGGALVFLG LAAAMPVMHG SKGCASFAKA LLTRHFNEPV 
PLQTTGVTEV SAVLGSGDDL VANLDGIRAK QNPRIIGLLT TGVTEVSGED VAGQVRQYIA 
MMNHTTPEGA PLIVRVSTPD FAGGLSDGWS AALRSLVATV PFDHADSDEY PGTRSGFGAG 
TGSAPETVAV LVGPSLSAAD LDELCALIRS FGMAPVLVPD LSGSLDGHLA PSWQPTTTGG 
TGLAQLRRLD EAGLIITAGA TAAEAGVDLA ARTAADLVQH DHLSGLAAVD SLVAELMTRS 
GRGPAPEVRR ARARLADGLL DTHFVLGGAR IALAMEPEAL VAVGSLLHDV GAEIVAAVSP 
TDAPVLATAP WDEIVIGDLT DLEERALEGG AELLIGSSHV RTVADRIGAA HLAVGFPIYD 
RLGSALRTTA GYGGSLRLLV DAANRLLDHH QADHQANHRA DHRPGRHDVR EHPLDSFDQL 
DVLCQESPC