Gene Franean1_4537 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4537
Symbol
ID	5672886
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5413092
End bp	5414258
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	73%
IMG OID	641243402
Product	iron-containing alcohol dehydrogenase
Protein accession	YP_001508818
Protein GI	158316310
COG category	[C] Energy production and conversion
COG ID	[COG1454] Alcohol dehydrogenase, class IV
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTTTC CGTCCGTAAG ACACGTGACA CCGTCCGTCC GCGTCTTCGC CGGCGAGGGC 
GCGCTCACCG CGCTGCCTCG CGAGTTCGAC CGCGCGGGGA TCCGGCGGGC GGTCGTGTTC 
TGCGGGGCCT CGATACGCCG TCACACCGAG GCGGTGGCAA GGGTCGAGTC GGCGCTTGGC 
GACCGGCTCG CCGGATGGTT CGACGGAGTC CGCGAGCACA GCCCGCTTCC CGCGGTCGAG 
CACGCGCGCG AGGTCCTGGA GGCGACCGGC GCCGACGCCG TGGTGGCGCT GGGTGGCGGG 
TCCGCCATCG TGACCGGCCG CGCCGCCAGC ATCCTGCTGG CGGAGAAGGC CGACGTTCGC 
GATGTCTGCA CCCGCCGCGT CGACGGCCGG CTGGTCAGCC CGAAGCTCGA CACGCCGAAG 
ATCCCCCAGT GGATCATTCC GAGTACTCCG ACCACGGCCT ACGCCAAGGC GGGAAGCGCG 
GTGCGGGACC CGGAGACCGG GGAGCGGCTG GCCCTGTTCG ACCCCAAGAC CCGCGCCGCC 
GGCGTGTTCA TGGATCCCGT GATCGCCGCC ACCGCGCCGG TGCCGCTGGT GCGGTCATCT 
GCCCTGAACG CCTTCGCCAT GGCCGTCGAC GGACTGCAGT CGGACACGGA CGATCCGCTC 
GCCGACGCGC TGCTGGCGTA TGCGCTCCGC CTGTCGAGGG AGTGGCTGCC GCGCCTCGAC 
GTCGCCTCGG ACGGGGAGCC GCGCCTGCGC CTCATGCTCG CCGCGCTCCT CGCGGGCCAG 
GGCAGCGACC ACACGGGCAC CGGCCTGGCT CAGGCGCTCT CGCACGCGGT CGGCCCGCGC 
TCCACGGTGG CGAACGGGAC AGTCGAGGCG ATGCTCCTGC CGCCCACGAT GCGCTTCAAC 
ACCCAGGTGA CGAAGCGGCG CCTCGTCCAG GTCGCGGAGG TCCTCAGCGG CGGACACCGG 
CCTGACGATG GTGCGGCCGA GGCGATCGAC GCCGTCGAGC ACCTGCTCGC GGCCGTCGGT 
GTGCCACGCC GCCTGCGCGA CGTCGGGGTT GATCGCGCGG CCCTGCCGGA GATCATCGAG 
CACGCCATGG ACGACTGGGC CATCACCCGT GTCCCGCGCC CGGCGACCCG GGAGGATCTC 
GAGGCGCTTC TTGACCGCGT CTGGTGA

Protein sequence

MSFPSVRHVT PSVRVFAGEG ALTALPREFD RAGIRRAVVF CGASIRRHTE AVARVESALG 
DRLAGWFDGV REHSPLPAVE HAREVLEATG ADAVVALGGG SAIVTGRAAS ILLAEKADVR 
DVCTRRVDGR LVSPKLDTPK IPQWIIPSTP TTAYAKAGSA VRDPETGERL ALFDPKTRAA 
GVFMDPVIAA TAPVPLVRSS ALNAFAMAVD GLQSDTDDPL ADALLAYALR LSREWLPRLD 
VASDGEPRLR LMLAALLAGQ GSDHTGTGLA QALSHAVGPR STVANGTVEA MLLPPTMRFN 
TQVTKRRLVQ VAEVLSGGHR PDDGAAEAID AVEHLLAAVG VPRRLRDVGV DRAALPEIIE 
HAMDDWAITR VPRPATREDL EALLDRVW