Gene Franean1_0924 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0924
Symbol
ID	5669338
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1074820
End bp	1075785
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	74%
IMG OID	641239851
Product	short-chain dehydrogenase/reductase SDR
Protein accession	YP_001505286
Protein GI	158312778
COG category	[I] Lipid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism [R] General function prediction only
COG ID	[COG1028] Dehydrogenases with different specificities (related to short-chain alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00780913
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.965318
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGGACG ACGACGTCCC GGCCGGTCAT TCCACGCGGA CCGCGCCGGA GGCCCAGGGG 
GCATCCACCG GACGACGGGC GCGACAGCCA CAGGCCGACG CCTCGGCCCC GGCGCGGGCG 
GTCACGGCAC CACGCCCACG AGCCGGCACG GCGGACGGCC CCGGCGATGA CGGTAGCGTC 
GCGACGGTGA CCGGCCCGTT CGCCAGGACG GCCGGCGACG CCGTCGCGGG CGGCGGCGAG 
TACGCCGGCC GGGTCGCCTT CGTGACCGGA TCCGGCTCGG GAATCGGCGC CGCCTGTGCC 
CGCCGGCTGG CCGCGGCCGG CGCCTTCGTC GTCCTGGCCG ACCGGGACAC CGTCGCGGCC 
AAGGAGGTCG CCGGCGAGAT CGAGGCGGCC GGCGGCACCG CACTGGCGGT GGCGGTCGAC 
GTCGCCGACC CGGAGTCGGT CGCCCAGGCC GTCGCCACGG CGATCGAGGC CGGTGGACGG 
CTCGACCTCG CGGTCAACAA CGCGGGCATC GCCACCGACC GGGCCCCGCT GGAGGACATC 
TCCCTCGCCG ACTGGGACCG GGTTCTCGCG GTCAACCTCT CCGGCGTCTT CTACAGCATG 
CGCGCCGAGA TCCCGGCGAT GCTCGCGGCC GGCGGCGGCT CGATCGTCAA CATGGCCTCC 
GTGCTGGGCA CGGTCGGCCT ACAGGGCACA CCGGCCTACG TCGCGGCCAA GCACGGCGTG 
ATCGGACTCA CCAGGGTGGC CGCGCTGGAC AACGCGACAC GCGGAATCCG GGTCAACGCG 
GTAGCACCCG GATTCATCGA CACCACGATG GTCAGCTCAC ACCGCGGAGC ACGCTTCTTC 
CAGCCGATGA ACCGGCTGGG GACCGCCGAC GAGGTCGCCG AGGTCGTCCA CTTCCTACTC 
TCCGACCGCG CGTCCCTGGT GACCGGCAGC GTCTACTCCG CCGACGGGGG ATTCACCGCC 
CGCTGA

Protein sequence

MTDDDVPAGH STRTAPEAQG ASTGRRARQP QADASAPARA VTAPRPRAGT ADGPGDDGSV 
ATVTGPFART AGDAVAGGGE YAGRVAFVTG SGSGIGAACA RRLAAAGAFV VLADRDTVAA 
KEVAGEIEAA GGTALAVAVD VADPESVAQA VATAIEAGGR LDLAVNNAGI ATDRAPLEDI 
SLADWDRVLA VNLSGVFYSM RAEIPAMLAA GGGSIVNMAS VLGTVGLQGT PAYVAAKHGV 
IGLTRVAALD NATRGIRVNA VAPGFIDTTM VSSHRGARFF QPMNRLGTAD EVAEVVHFLL 
SDRASLVTGS VYSADGGFTA R