Gene Franean1_6089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6089
Symbol
ID	5674410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7413262
End bp	7414605
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	72%
IMG OID	641244941
Product	NADH-quinone oxidoreductase, F subunit
Protein accession	YP_001510339
Protein GI	158317831
COG category	[C] Energy production and conversion
COG ID	[COG1894] NADH:ubiquinone oxidoreductase, NADH-binding (51 kD) subunit
TIGRFAM ID	[TIGR01959] NADH-quinone oxidoreductase, F subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0248618
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGTCA CCCCGGTCCT CACCCGGCGC TGGACGGCGC CCGAGTCGTG GACGCTGGCG 
ACCTACGAGC GCCTTGACGG CTACCAGGGC CTGCGCCGGG CGCTGGCGCA GAGCCCGGAC 
GACCTGATCA AGCTGGTCAA GGACTCCGGC CTGCGCGGTC GCGGCGGCGC GGGCTTCCCC 
ACCGGTATGA AGTGGGGCTT CATCCCGCAG GGCGACGGCA AACCGCACTA CCTCGTCATC 
AACGCCGACG AGGGCGAGCC GGGCACCTGC AAGGACGCCC CGCTGATGAA GGCCGACCCG 
CACTCGCTGA TCGAGGGCAT CGTGATCGCC GCCTACGCGG TGCGCGCGAA CCGGGCCTTC 
ATCTACCTGC GCGGCGAGCT GATCCACGCC GGCCGGCGGC TGCGCGCCGC CGTCGCCGAG 
GCGTACCGCG CCGGCTACCT GGGACGCGAC ATCCTCGGTA GCGGGTTCGA CCTCGACCTG 
GTGGTGCACT CCGGCGCCGG CGCGTACATC TGCGGCGAGG AGACGGCGCT GCTGGACTCG 
CTGGAGGGCC GGCGCGGCCA GCCGCGGCTG CGCCCGCCGT TCCCGGCGAC CCACGGCCTG 
TACGCGTCCC CCACGGTCGT GAACAACGTC GAGACGATCG CCACCGTTCC CTTCATCGTG 
AACTACGGCG TCGACTGGTT CCGGTCGATG GGCCGCGAGC GCGCCCCGGG CCCGAAGATC 
TACAGCCTCT CCGGCCACGT GACCCACCCC GGCCAGTACG AGGCGCCGAT GGGCACGACG 
CTGCGCGAGC TGCTCGACAT GGCGGGCGGC GTCCTCGGCG GCCGCAAGCT CAAGGCGTGG 
ACCCCGGGCG GCTCGTCGAC GCCGCTGCTG ACCGCCGACC ACCTTGACGT CCCGCTGGAC 
TTCGAGGGCG TGCAGGAGGC CGGCTCGCTG CTCGGCACGG CCGCCCTCAT GATCATGGAC 
GACTCGGTCG ACATGCTCAA GATCGTGCGG CGGCTGACCC AGTTCTACGC GCACGAGTCG 
TGCGGCAAGT GCACCCCGTG CCGGGAGGGC ACCACCTGGA TGGTGCAGAT CCTGTCCCGG 
ATGGAGCGCG GCCAGGGCGA CCCCGACGAC GTCGACACCC TCGTCGACGC CTGCGACAAC 
ATCTTCGGAC GCGCCTTCTG CGCGCTCGCG GACGGCGCCA CCTCGCCGAT CGTCTCCGGG 
ATCAAGTTCT TCCGGAACGA GTTCCTCCCG ATCACCCCGG TGGGGCCGTC GGGTTCCACC 
ACGTCGGTAG CCGGCTCGGC GAACGGCGCG GCCGCGGGTG GCGCGGCCGC GGGCACGCCG 
GGCGCCTACG CGGGAGCGCA CTGA

Protein sequence

MPVTPVLTRR WTAPESWTLA TYERLDGYQG LRRALAQSPD DLIKLVKDSG LRGRGGAGFP 
TGMKWGFIPQ GDGKPHYLVI NADEGEPGTC KDAPLMKADP HSLIEGIVIA AYAVRANRAF 
IYLRGELIHA GRRLRAAVAE AYRAGYLGRD ILGSGFDLDL VVHSGAGAYI CGEETALLDS 
LEGRRGQPRL RPPFPATHGL YASPTVVNNV ETIATVPFIV NYGVDWFRSM GRERAPGPKI 
YSLSGHVTHP GQYEAPMGTT LRELLDMAGG VLGGRKLKAW TPGGSSTPLL TADHLDVPLD 
FEGVQEAGSL LGTAALMIMD DSVDMLKIVR RLTQFYAHES CGKCTPCREG TTWMVQILSR 
MERGQGDPDD VDTLVDACDN IFGRAFCALA DGATSPIVSG IKFFRNEFLP ITPVGPSGST 
TSVAGSANGA AAGGAAAGTP GAYAGAH