Gene Franean1_6085 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6085
Symbol
ID	5674406
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7407674
End bp	7408645
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	73%
IMG OID	641244937
Product	NADH dehydrogenase subunit J
Protein accession	YP_001510335
Protein GI	158317827
COG category	[C] Energy production and conversion
COG ID	[COG0839] NADH:ubiquinone oxidoreductase subunit 6 (chain J)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.302185
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0550219
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCCGC AGATTCTCGC CCAGGCGGCG GAGATCAGCA GCACGTCGAA CGGCGAGGCC 
TGGACGTTCT GGCTGCTCGC GCCGGTGGCG CTGCTGGCGG CGCTCGGCAT GGTCCTGATG 
CGCAGCGCGG TGCACTCCGC CCTGCTGCTC GTGGTGAACC TGTTCTGCGT CGCGGTGTTC 
TACCTGATCC AGGACGCGCC CTTCCTGGGC TTCGTCCAGA TCATCGTCTA CACCGGCGCG 
ATCATGGTGT TGTTCCTGTT CGTGCTGATG CTGGTCGGAG TCGATTCGTC CGACTCGCTG 
GTCGAGACCC TGCGCGGCCA GCGGATCGCC GCGGTGATCC TCGGGCTCGG CTTCGCCGGC 
CTGCTGGCGT TCCCGATCGG CCGCGCGATC GACGGTGGCA AGGCGGCGGG CCTGGAGGCG 
GCGAACACCG GCGGCAACGT CCACGCGATC GGACGTCTGC TGTTCACCCA GTACGTCTTC 
GTCTTCGAAG CGATCTCGGT GCTGCTCGTG GTCGCGGCGA TCGGGACGAT GGTCCTCGGC 
CACCGCGAGC ACACCGGTGA GAAGGTCACG CAGAAGGAAC GGATGCGCGC TCGCTTCGCC 
GAGGGCGGCA CCGTCACCCC GCGGCCCGGG CCGAAGGTCT TCGCGACCAA CCCCGGCCCG 
GAGCAGCCCG AGCTCGTCGC GGCCGGCGGT GGCGATGCCG CCGGCGGCGG CCCGGACCTC 
GGCGGGCCCG GTGCGGGCCC GTCCGGCCCG GCCGGCGCGG GTGGTCCGGA CGACGGCGGT 
ACCGGTGGTC CGGGCGGTCC TGGGACAGGC GGTCCCGGTG CGGGCGGTGC TGGTGGTCCG 
GGTACGGACG GCCCGGGCGG CGGTGGGCCC GACGGCGGGC CGAGCGCGAA CGGGACGAGT 
GAGGACTCCG ACGACGAGAC CGTCGTCGGC GGGTCGGCGC CGGTGGGCGC GGGCAGGGGG 
AGCGGTCGGT GA

Protein sequence

MNPQILAQAA EISSTSNGEA WTFWLLAPVA LLAALGMVLM RSAVHSALLL VVNLFCVAVF 
YLIQDAPFLG FVQIIVYTGA IMVLFLFVLM LVGVDSSDSL VETLRGQRIA AVILGLGFAG 
LLAFPIGRAI DGGKAAGLEA ANTGGNVHAI GRLLFTQYVF VFEAISVLLV VAAIGTMVLG 
HREHTGEKVT QKERMRARFA EGGTVTPRPG PKVFATNPGP EQPELVAAGG GDAAGGGPDL 
GGPGAGPSGP AGAGGPDDGG TGGPGGPGTG GPGAGGAGGP GTDGPGGGGP DGGPSANGTS 
EDSDDETVVG GSAPVGAGRG SGR