Gene Franean1_4598 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4598
Symbol
ID	5672943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5479162
End bp	5480199
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	70%
IMG OID	641243459
Product	alcohol dehydrogenase
Protein accession	YP_001508875
Protein GI	158316367
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTCGTG CGATTGTTTT CAACGGTGAC CGGACCTGGG AGGAGCGCGA CCTGCCGGTG 
CCTGATCCCC AGCCGGGTGG CGCGGTGCTG CGGGTGGAGG CGACGGGCTT GTGTCACGGC 
GACGTCGACC AGTTCCACGG CATCGGTCGC ACCCCGAGAG GCGGGGCGTT CCCCGTGGTT 
CCAGGCCATG AGGTCGTCGG CCGGATCGAG AAGATCGACG CGCGGGCAGC CGAGGAATGG 
GGCGTCGCGG AAGGAGACCG GGTCGCCGTC CGCACGATCG TCATCACCCC CGAAGGCGGC 
ACCCGCGCCT ACGGGATCGA CTTCTCGGTG AAGGAGGGCT CCGGTCTCTA CGGCGGTTAT 
GCCGACTACA TGGAGATCCT GCCGGGATCC GCGGTCTACC GCCTCCGGGA GGACCTTCCC 
GCGGCGGAGC TCACGATCTT CGAGGCGTTG TCCTGCGCGG TCACGTGGGT CCACCCGGTC 
AAGGACGATC ACACCGTCGT CATCGAGGGA CCCGGCCACA TGGGCCTGGC CACCGTCGTC 
GCGGCCCGCG CCGCGGGCGC TGGCACGATC GTGGTCACCG GCCTCTCGCA GGACCGGTCC 
CGGCTCGACT GCGCCCTGCA GGTGGGCGCT GACCACGTGA TCGACGTCCA GACGGAGAAC 
GCCGCGCAGC GCCTCGCCGA CATCACCGGT GGACGCATGG CCGACGTCGT GATCGACGCG 
GCGTCCGGGA GCTCGGTGAC GGTCAACACC GCGATGGAGC TTGTCGGCAG GGGCGGCCAC 
ATCGTCATCG CCGGGCTGAA GGACGAGCCG GTGAACGGCC TGGACAGCAA CTCGCTCCTG 
TTCCGGGGGA TCACCATCGG TCCCGGGGCC GGACTCGACG CGGCCCGCGC GGTCGCGCTC 
ATCAACGACG GCCAGGTGCC GACCGCCGCG CTGGCCGGCG AGACCTTCCC GCTCGATCGC 
TTCGAAGACG CCTTCGCGCT GCTGGATCGC CGTGTCCCCG GCCGTGACGC GGTGCGGGTG 
TCGCTGCACG TCTCGTGA

Protein sequence

MGRAIVFNGD RTWEERDLPV PDPQPGGAVL RVEATGLCHG DVDQFHGIGR TPRGGAFPVV 
PGHEVVGRIE KIDARAAEEW GVAEGDRVAV RTIVITPEGG TRAYGIDFSV KEGSGLYGGY 
ADYMEILPGS AVYRLREDLP AAELTIFEAL SCAVTWVHPV KDDHTVVIEG PGHMGLATVV 
AARAAGAGTI VVTGLSQDRS RLDCALQVGA DHVIDVQTEN AAQRLADITG GRMADVVIDA 
ASGSSVTVNT AMELVGRGGH IVIAGLKDEP VNGLDSNSLL FRGITIGPGA GLDAARAVAL 
INDGQVPTAA LAGETFPLDR FEDAFALLDR RVPGRDAVRV SLHVS