Gene Franean1_0928 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0928
Symbol
ID	5669342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1083606
End bp	1084625
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	71%
IMG OID	641239855
Product	aldo/keto reductase
Protein accession	YP_001505290
Protein GI	158312782
COG category	[C] Energy production and conversion
COG ID	[COG0667] Predicted oxidoreductases (related to aryl-alcohol dehydrogenases)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.339617
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGTACC GCACCCTCGG CCGGACCGGC ATCCAGGTCA GCCCCTACGC CCTGGGCACC 
CTGATGTTCG CCACCTCCAT GGGCAACGCC CCCGAGGAGT CGGTCCGCAT CATCCACAGG 
GCGCTCGACG CCGGCATCAA CCTCATCGAC ACCGCCGACG CCTACGGCGA CTCCGAGGAC 
ATCGTCGGCA GGGCGCTGGA AGGGCGCCGC GACGACGTCG TGCTCGCCAC CAAGTTCGGT 
CGCCCGACCG CGCAGAACCC CAACCGCCAG GGCGCCTCAC GGCGCCGGAT CGTCGCCGCC 
GTGGAGAACT CGCTGCGCCG CCTGCGGACG GACCACATCG ATCTCTACCA ACTTCACCGC 
CCCGATCCCC GCACCGACGT CGAGGAGACC CTCTCCGCGC TGACCGACCT GATCCGCAGT 
GGCAAGGTCC GCGCGATCGG GGCGTCGGGG ACCCCCGTCT CCGACATCGT CGAGGCCCAG 
TGGGTCGCCG GGCAGCGCGG CCTCGCGCGA TTCCACACCG AGCAGCCGGT CTACTCCATC 
CTCAACCGCG GCATCGAGCG CGAGATCCTG CCCACCATCG AACGTTTCGG CATGGGCACC 
CTGGTCTGGG GCCCACTCGG CCAGGGACTG CTCACCGGCC GCGTCCGCAG GAACGAGGAG 
AACAACCTCC TGCGCGCCGG CCTGGTCCGG CATCTCAACG ACGAGCGCCG GCTCGACGTG 
GTCGAGCAGC TCGTCCCCCT CGCCGCCGAG GCGGGAATGC CCATGACCCA TCTCGCGATG 
GCGTTCGCCA TCACTCACCC GGGCGTCACC AGCGCACTGG TCGGCGCCCG CACCATGGAC 
CACCTCGACA GCCTGCTCAC CGGCCTGGAC GTCACCCTCA CCGACGACAT CCTCGACCGC 
ATCGACGAGA TCGTCCCGCC CGGCGCCGAC ATCGGCACCC TCGACCAGGC CTACCGGCCC 
CCGGCTCTCG ACGCCCCGGG CCTTCGCCGC CGCCCCCGGA CCGCACGCGC AGCAGCCTGA

Protein sequence

MRYRTLGRTG IQVSPYALGT LMFATSMGNA PEESVRIIHR ALDAGINLID TADAYGDSED 
IVGRALEGRR DDVVLATKFG RPTAQNPNRQ GASRRRIVAA VENSLRRLRT DHIDLYQLHR 
PDPRTDVEET LSALTDLIRS GKVRAIGASG TPVSDIVEAQ WVAGQRGLAR FHTEQPVYSI 
LNRGIEREIL PTIERFGMGT LVWGPLGQGL LTGRVRRNEE NNLLRAGLVR HLNDERRLDV 
VEQLVPLAAE AGMPMTHLAM AFAITHPGVT SALVGARTMD HLDSLLTGLD VTLTDDILDR 
IDEIVPPGAD IGTLDQAYRP PALDAPGLRR RPRTARAAA