Gene Francci3_0551 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0551
Symbol
ID	3904202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	640054
End bp	641589
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	68%
IMG OID	637877880
Product	NADH dehydrogenase subunit N
Protein accession	YP_479664
Protein GI	86739264
COG category	[C] Energy production and conversion
COG ID	[COG1007] NADH:ubiquinone oxidoreductase subunit 2 (chain N)
TIGRFAM ID	[TIGR01770] proton-translocating NADH-quinone oxidoreductase, chain N

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.170778
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACAC CGCCGTCGAT CGAGTACTCC TCGCTCAGCC CGATCCTGAT CGTGTTCGGG 
GTCGCGCTCG TCGGGGTGCT CGTCGACGCC TTCGCCACGA AGCGGGCCCG GCGGACCTTC 
CAACCGATCC TGGCGGGTGC GGGCTTCGTC GCCGCGCTCG TGGCCGTGGC GGTGCTGCAC 
GGCCGGCAGG CCATCCTCGC CTCCGGTGCG CTGGCGATCG ACGCGCCGAC CTTGTTCATG 
CAGGGCACGA TCCTGGTCTT CGCCCTGCTG TCGGTGCTGC TGGTGGCCGA ACGCCAGCTT 
GACTCGTCCG GCGGGGCTAT TGTGGCCTCG GCCGCGATCA CCCCGGGCTC GAAGGGATCG 
ACGGCGCAGC AGACCTCGGC AGACGTGCAG ACCGAGGCGT ATCCGCTGAT GGTCTTCTCG 
GTCACCGGGA TGATGCTCTT CGTCGCCTCG AACAACCTGC TAGTGATGTT CGTGGCGCTG 
GAGATCCTCT CGTTGCCGCT GTACCTGCTG GCCGGGCTCG CCCGGCGCCG TCGGCTGCTG 
TCGCAGGAAG CGGCGATGAA GTACTTCCTG CTCGGGGCGT TCTCCTCGGC CTTCTTCCTC 
TACGGCGTCG CGTTCGCCTA CGGATTTGCC GGCAGCGTGG AGCTCGGGGC GGTCGCGGAC 
GCGGTCAGCA ACGCCGGTGC GAACGACACC TACCTCTATC TGTCGCTCGC GCTGCTGGCG 
GTGGGGCTGT TCTTCAAGAT CGGCGCCGTG CCGTTCCACT CCTGGACGCC GGACGTCTAC 
CAGGGCTCGC CGACGCCGGT TACCGCGTTC ATGGCGGCGG GGACGAAGGT CGCCGCGTTC 
GGTGCCCTGT TGCGGGTCTT CTACGTCGCC TTCGGAGGGC TGCGCTGGGA CTGGCGACCA 
ATCCTGTGGA CGATCGCCAT CCTCACCATG GTGGTCGGCG CGGTGCTCGC CCTGACCCAG 
CGTGACATCA AGCGTATGCT GGCCTACTCG GCGATCGCGC ACGCCGGGTT CCTGCTGGTG 
GGCCTCGCCG GCACCAACAC CGACGGCCTG CGCGGCTCGA TGTTCTACCT GGTGACCTAC 
GGCTTCACGA CGATCGCCGC CTTCGCCGTG GTCTCCCTGG TCCGTACCGG CGACGGCGAG 
GCCGGCGACC TGTCCCAGTG GCGGGGGCTC GGCAGGACCT CGCCCCTGCT GGCCGGGACG 
TTCTCGTTCC TGCTGCTCGC GCTCGCGGGG ATCCCGCTGA CGAGCGGGTT CACCGGGAAG 
TTCGCGGTGT TCCAGGCCGC GATCGCCGGG GACGCCACCC CGCTGGTAGT CGTTGCACTG 
GTGTGCAGCG CCATCGCCGC CTTCTTCTAC GTGCGGGTCA TCGTGCTGAT GTTCTTCTCC 
GAGCCGCTTG CCGAGGGACC GGTGGTGGTG ACCCGCCCGA CGCTGACCTT CGCCGCGGTC 
GCCATCGGTA CCGTGGCTAC TCTTGTACTG GGAGTAGCGC CACAGCCACT CCTGGACCTC 
GCGACGACCG CCGCGACGTC CGGCTTCGTA CGCTGA

Protein sequence

MITPPSIEYS SLSPILIVFG VALVGVLVDA FATKRARRTF QPILAGAGFV AALVAVAVLH 
GRQAILASGA LAIDAPTLFM QGTILVFALL SVLLVAERQL DSSGGAIVAS AAITPGSKGS 
TAQQTSADVQ TEAYPLMVFS VTGMMLFVAS NNLLVMFVAL EILSLPLYLL AGLARRRRLL 
SQEAAMKYFL LGAFSSAFFL YGVAFAYGFA GSVELGAVAD AVSNAGANDT YLYLSLALLA 
VGLFFKIGAV PFHSWTPDVY QGSPTPVTAF MAAGTKVAAF GALLRVFYVA FGGLRWDWRP 
ILWTIAILTM VVGAVLALTQ RDIKRMLAYS AIAHAGFLLV GLAGTNTDGL RGSMFYLVTY 
GFTTIAAFAV VSLVRTGDGE AGDLSQWRGL GRTSPLLAGT FSFLLLALAG IPLTSGFTGK 
FAVFQAAIAG DATPLVVVAL VCSAIAAFFY VRVIVLMFFS EPLAEGPVVV TRPTLTFAAV 
AIGTVATLVL GVAPQPLLDL ATTAATSGFV R