Gene Franean1_5041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5041
Symbol
ID	5673377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6041357
End bp	6042328
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	69%
IMG OID	641243892
Product	alcohol dehydrogenase
Protein accession	YP_001509307
Protein GI	158316799
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.750804
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.131881
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGGCTG CGGTGCATGC CAGGTACGGC CCACCGGAGG TTGTGGGAAT TCAGGAGGTC 
GACAAGCCCA CGGCCGGCGT CGGTGAGGTG CTGGTCAAGG TGCATGCGGC GACGGTGAAC 
CGCACCGACT GTGGCTACCG GGCCGCCAGA CCGTTTATCG TGCGGTTCTT CGCGGGGCTG 
GCCAGGCCGA AGGCGATGAT CCTCGGGAAC GAGTTCGCCG GGGTGGTCGA GGCCGTCGGC 
ACCGATGTCA CCACCTTCCT GGTCGGGGAC GGCGTCTTCG GCTACAACGA GGGTCCCTTC 
GGAGCCCACG CGGAGTACTT GGCCGTCCGT GCCGACGGCC TGCTCGCGCA CGTACCGGCG 
GGGGTGGCCT TCGAGCAGGC CGCCGCTGCC ACCGAGGGCG CGCACTACGC CCTGTCGTTC 
ATCACCAAGA TCCCGGCCTG GGACGGGGCG CGGATCCTGG TCAACGGGGC GACTGGGGCC 
ATCGGTTCGG CGGCGGTCCA GCTCCTGAAG TGCCGCGGCG CCCAGGTGAC CGCGGTATGC 
GGCCCGGACG GCGTCGACCA GGTGCGAGAG CTGGGCGCCG ACCGGGTCAT CGACCGCACG 
ACGTGCGACT TCACCAGGGA CGAGCATGTC TACGACGCCG TCTTCGACGC GGTCGGCAAG 
AGCTCGTTCG GCCGGTGCAG ACGGCTGCTG CGTCCCGGCG GGGTGTACTC CTCGACCGAG 
CCCGGCCGGT TCGCGCAGAA CCTGGTGCTG GCGATGCTCA CCCCGCTGCT GCGTGGCAGG 
AAGGTGCTGT TCCCGCTCCC GTCGATCGAC AGGAAGACGG TGGAATACAT CCGGGACCTG 
CTCGCTTCGG GACGGTTCCG GCCGCTTCTC GACCGGCGGT ACCCGCTGGA GCAGATCGTG 
GAGGCCTACC GGTACGTCGA GTCCGGGCAG AAGATCGGCA ACGTTGTGAT CGCGGTCCGG 
CCCTCGGAAT GA

Protein sequence

MRAAVHARYG PPEVVGIQEV DKPTAGVGEV LVKVHAATVN RTDCGYRAAR PFIVRFFAGL 
ARPKAMILGN EFAGVVEAVG TDVTTFLVGD GVFGYNEGPF GAHAEYLAVR ADGLLAHVPA 
GVAFEQAAAA TEGAHYALSF ITKIPAWDGA RILVNGATGA IGSAAVQLLK CRGAQVTAVC 
GPDGVDQVRE LGADRVIDRT TCDFTRDEHV YDAVFDAVGK SSFGRCRRLL RPGGVYSSTE 
PGRFAQNLVL AMLTPLLRGR KVLFPLPSID RKTVEYIRDL LASGRFRPLL DRRYPLEQIV 
EAYRYVESGQ KIGNVVIAVR PSE