Gene Franean1_3990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3990
Symbol
ID	5672350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4774985
End bp	4775959
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	70%
IMG OID	641242868
Product	alcohol dehydrogenase
Protein accession	YP_001508285
Protein GI	158315777
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.396806
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.582134
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTGCGA TACGGCTACA CGCCTTCGGC CCCGCCGAGA ACCTGGTCTG CGAAGACGTC 
CCCGACCTGC TCCCGGCCGA GGGGCAGGTG CGGATTGATG TGCAGGCCAG CGGTGTCCAC 
CTGATCGAGA CCAGGCTTCG GCGTGGCGTC GGGGTCGGCC CGCATCTGCC ACCGGAGCTG 
CCGACCACGC TCGGCGGGGA GGTCGCCGGT GTCGTGGGGG CGGTGGGTTC CGGTGTGGGA 
ACGGGATGGC TGGGCCGCCG GGTTGTGGCG CAGCTGGGGG CAGGCGGCGG GTACGCCGAG 
CAGGCCGTCG CTTCCGCGGA CTCCGTGCAC GTACTGCCCG AGCACCTGGA CGCGGAGACA 
GCGGTGGCAG TCGTCACGAA CGGGGCCACC GCTCAGGGCG TGCTGGGAGT GGCGAACTTG 
ACCACGGATG ACGTGGTGCT GGTGATGTCT GCGGCTGGTG GACTGGGCAG CCTGTTCGTC 
CAAGCGGCCC ATCACGCCGG TGTCACCGTC GTGGGTGTGG CCGGGGGCGA TGCGAGGGCC 
GCTCGTGCCC GTGAGCTCGG CGCTGATGTC GCGGTGGACT ACCAGGATGC CGACTGGCCC 
GCGCTTGTCC GTGAGGCTCT GGACGGACGT GCGGTGAGCG TGGTCCTTGA TGGCGTCGGC 
GGCGTTCTCG GCCGCCAGGC ACTGGAACTG CTCGGCCCCG GTGGGCGCTT CCTGATGTAT 
GGCTGGGCGG CCGGGGAACC GACCGCGATC ACCACACGTG ACCTCGTGGA GCGCGAGTTG 
ACGGCGACCT GGGCGATCGG GCCGAACGCA ACCCCCTCCG GTGGTTGGCG CGAGTTGGCG 
GCTCGGGCCC TGGAAGAAGC AGCGGCAGGC CGTCTCGTTC CGCTGATGAC GCGTTTCCTC 
CTGGAGCGAG CGGCCGATGC GCACTCTGCC CTGGAAGCCC GCGAGGCCGA AGGCAAAGTG 
GTACTTACCA TCTAG

Protein sequence

MRAIRLHAFG PAENLVCEDV PDLLPAEGQV RIDVQASGVH LIETRLRRGV GVGPHLPPEL 
PTTLGGEVAG VVGAVGSGVG TGWLGRRVVA QLGAGGGYAE QAVASADSVH VLPEHLDAET 
AVAVVTNGAT AQGVLGVANL TTDDVVLVMS AAGGLGSLFV QAAHHAGVTV VGVAGGDARA 
ARARELGADV AVDYQDADWP ALVREALDGR AVSVVLDGVG GVLGRQALEL LGPGGRFLMY 
GWAAGEPTAI TTRDLVEREL TATWAIGPNA TPSGGWRELA ARALEEAAAG RLVPLMTRFL 
LERAADAHSA LEAREAEGKV VLTI