Gene Franean1_5391 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5391
Symbol
ID	5673723
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	6501764
End bp	6502978
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	66%
IMG OID	641244247
Product	alcohol dehydrogenase
Protein accession	YP_001509653
Protein GI	158317145
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.515242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGCAG TCGTGTGGCA CGGCGTGGGC GACATCCGCC TTGACACCGT CACCGAACCG 
AAGATCGAAC AGCCGACCGA TGCCGTCGTT CGCATCACCA CCGCGGCGAT CTGTGGCACG 
GATCTTCATT TCGTCCGGGG CACAGTACCG GGGATGAAGC CGGGCCTCAT CATCGGGCAC 
GAAGGGGTCG GCGTGGTCGA AGAGGTCGGC CAGAGCGTCC GCAACTTCAG GCGCGGCGAT 
CGGGTGCTGC TGTCCGCCGT CCTCGGGTGC GGCTCCTGCA CCTACTGCCG CAGCGGCTAT 
TTCGCCCAAT GTGACGACAT CAACCCGTAC GGCCGCAGGA CCGGATCTGC CTTCTACGGC 
GCTCCGAGGG ACAATGGCTC GTTCGACGGG TTGCAGGCTG AGTACGCCCG CGTACCCTAC 
GCCCACACCA ATCTGTTCCG GCTGTCAGAC TCGATCTCCG ATGATCAGGC GATCCCGCTG 
TCGGACATCT ACCCCACCGG ATACTTCGGC GCAGTCATCG CGGAAGTATC GGATGGCGAC 
GTGGTGGCGG TCTGGGGCTG CGGGCCGGTG GGACAGTTCG CCGTTCTGTC CTCATTCCAG 
CGCGGCGCCG CGCGGGTGAT CGCGATCGAT GGTCACGCCG ACCGACTCGA CCGTGCCCAG 
GCGCTCGGAG CCGAGGTGGT CAACTTCAAC GAAGAGGACC CTGTCGAGGC AATCCTGGAT 
CTGACACGCG GTATCGGTCC CGACCGGGCC ATCGACGCCG TGGGGGTGGA CGCGGAAAGC 
CCGAAGTCCG GCCCCGCCGC CGCCCGCGCC CGCGAACAGG ACGATCAGCA CCGCGAGGAA 
CTGCGTCAGA TCGCCCCCGA GACTCACGCG CACAACGGAC ACTGGAAGCC TGGCGACGCG 
CCGACGCAGG CCCACTCCTG GGCAGTCGAG AGCCTGGCCA AGGCAGGCAC GCTGGGCATC 
ATCGGGGTGT ATCCGCCGAC CGACAGGTTC TTCCCGATCG GCACCGCGAT GAACAAGAAC 
CTCACCATCA ACATGGGAAA CGGCAACCAT CCGCGGTACA TCCCGAAGCT GCTGGATATG 
GTGGAGTCGG GAGTGGTGCA CCCACAGAAA ATGGTCACCC AGCATGAGCC GATGCGGGAC 
GTGCTCGCCG CCTACGAGGA GTTCGACCTG CGCCGTCCTG GCTGGCTCAA GGTGGCCCTG 
GACCTGACCA GCTAA

Protein sequence

MRAVVWHGVG DIRLDTVTEP KIEQPTDAVV RITTAAICGT DLHFVRGTVP GMKPGLIIGH 
EGVGVVEEVG QSVRNFRRGD RVLLSAVLGC GSCTYCRSGY FAQCDDINPY GRRTGSAFYG 
APRDNGSFDG LQAEYARVPY AHTNLFRLSD SISDDQAIPL SDIYPTGYFG AVIAEVSDGD 
VVAVWGCGPV GQFAVLSSFQ RGAARVIAID GHADRLDRAQ ALGAEVVNFN EEDPVEAILD 
LTRGIGPDRA IDAVGVDAES PKSGPAAARA REQDDQHREE LRQIAPETHA HNGHWKPGDA 
PTQAHSWAVE SLAKAGTLGI IGVYPPTDRF FPIGTAMNKN LTINMGNGNH PRYIPKLLDM 
VESGVVHPQK MVTQHEPMRD VLAAYEEFDL RRPGWLKVAL DLTS