Gene Franean1_4744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4744
Symbol
ID	5673086
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5665819
End bp	5666745
Gene Length	927 bp
Protein Length	308 aa
Translation table	11
GC content	71%
IMG OID	641243601
Product	acetaldehyde dehydrogenase
Protein accession	YP_001509017
Protein GI	158316509
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4569] Acetaldehyde dehydrogenase (acetylating)
TIGRFAM ID	[TIGR03215] acetaldehyde dehydrogenase (acetylating)

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCAGCAGG TGGCGATCAT CGGGTCGGGG AACATCGGCA CCGACCTCCT GATCAAGATC 
AAGCGAAGGT CCGAGTCGCT GAGCGTGGCG GCCATGGTGG GGATCGACCC GGAGTCCGAC 
GGCCTCGCCC GCGCCAGGCG GCTGGGCGTC GCCACGACGT CCGACGGGGT GGCCGGTCTC 
CTGGCGATGC CCGAGTTCGA ACAGGCCGGC ATCGTGCTCG ACGCGACGAG CGCCAACGCG 
CACCGGGCGA ACGCCGCGGC GCTGGCCCCG TACGGCCGGC GGCTGATCGA CCTCACCCCG 
GCGGCGCTCG GGCCGTTCGT GGTGCCCGCG GTCAACCTCG ACGAGCACCT GAGCGCCCCC 
AACGTCAACA TGACGACCTG CGGCGGGCAG GCCACCGTCC CGATCGTCGC GGCGATCTCA 
CGCGTCACCC CGGTGGCCTA CGCGGAGATC GTCGCCACGG TGGCGTCGAA GTCCGCCGGG 
CCCGGCACCC GCGCCAACAT CGACGAGTTC ACCGAGACGA CGGCGCACGC GCTGGAGTCG 
GTGGGCGGCG CGCGGCGCGG CAAGGCCATC ATCATCCTGA ACCCGGCCGA GCCGCCGCTC 
ATCATGCGGG ACACCGTGCT CTGCCTGGTC GGCGACGTCG ACCGGGACGC GGTCACCGAA 
TCGATCCACC GGATGATCGC GGACGTCGCC GCCTACGTGC CCGGCTACCG CCTGAAGCAG 
GACGTGCAGT TCACTCCCGT GGACCCGGCC GAGATGCGCA TTCTCCTGCC GGACGACACG 
GTCGACGTCC GCTGGAAGGT GAGCGTGTTC CTCGAGGTGG AGGGCGCCGC TCATTATCTG 
CCGGCCTACG CCGGCAACCT GGACATCATG ACGTCGGCGG CCGTGCGGGT CGCCGAGCGC 
ATCGCTGGAG CCGAGGTGAC GGCATGA

Protein sequence

MQQVAIIGSG NIGTDLLIKI KRRSESLSVA AMVGIDPESD GLARARRLGV ATTSDGVAGL 
LAMPEFEQAG IVLDATSANA HRANAAALAP YGRRLIDLTP AALGPFVVPA VNLDEHLSAP 
NVNMTTCGGQ ATVPIVAAIS RVTPVAYAEI VATVASKSAG PGTRANIDEF TETTAHALES 
VGGARRGKAI IILNPAEPPL IMRDTVLCLV GDVDRDAVTE SIHRMIADVA AYVPGYRLKQ 
DVQFTPVDPA EMRILLPDDT VDVRWKVSVF LEVEGAAHYL PAYAGNLDIM TSAAVRVAER 
IAGAEVTA