Gene Franean1_4169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4169
Symbol
ID	5672524
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4954737
End bp	4955999
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	75%
IMG OID	641243042
Product	alcohol dehydrogenase
Protein accession	YP_001508459
Protein GI	158315951
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.235444
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.177218
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACACGCG GTCTGGAGCT GTACCGGTCG CTGCCGCGGT ACGCGGCGGC GCGGGTGGTG 
TCGGGCCGGT TCCCGCGGCT GTCGGGGGCG GCGGCGACGA CCGCGGCGCC GCTGCGGCTG 
GTCGACCGGG GGGATCCGGG TCTGCCGGGG CCGGGGTGGG TGACGGTGCG GCCACGGCTG 
GCGGGGATCT GCGGGTCGGA TCTGGCGACG GTGACGGGGC AGAGCTCGTT CTACTTCTCC 
CCGCTGGTGT CGATGCCGTT CACCCCCGGC CATGAGATCG TCGGTGACCT GCAGGAGGCG 
GTGACGCTCG CCGACGGGCG CCGGTTGGAC GCCGGTGCCC GGGTGGTGAT CGACCCGGTG 
CTGGGCTGCG CGGCCCGCGG GTTGGAGCTG TGCGTGGGCT GCGCGGCGGG CCGGACGTCA 
CGCTGCGACC GGATCACGGT GGGGCATCTG GCGCCGGGGT TGCAGACCGG GTTCTGCGCG 
GACACCGGTG GCGGGTGGAG CCGGGCGCTG GTCGCCCATC ACAGCCAGCT GCATCCGGTG 
CCCGACACGC TGCCCGACTC TCGGGCGGTG CTGGTCGAGC CGTTGGCGAC CGCCGTGCAC 
ACCGCGGGCC GCTGCGGGGT GCGTTCCGGG GACCGGGTGC TGATCATCGG GTCGGGGGCG 
GTGGGCCTGC TGACGCTGCT GGCCATCCGC GCCTATACGA AGGCCGAGCA TGTGACGATG 
GTCGCCAAGC ATCGGCGGCA GGTGGAGCTG GCGCGTCGTT TCGGCGCGGA CGAGGTGCTC 
GCCCCCGACG ACGCGGTCGG CGGGGTGCGC CGCGCGAACC GGGCGTTGCG GCTGACCCCG 
CAGCTGGGTG GGGAGTATCT GCTCGGCGGG GTGGATGTGG CGATCGACTG TGCGGGCAGC 
GCGTCGTCGC TGTCGACGGC GCTGCGGGTG ACCCGGGCCG GTGGCCGGGT GGTGCTCTCC 
GGGGTGCCGG CGGGGTCGGT GGATCTGACC CCGCTGTGGT TCCGGGAGCT GGAGCTGGTG 
GGGACGTACG CGTCGTCCGG TGGCGCCCGG CCCGGCCGGG CCGGTACCGA ACCGGCGGGA 
CCAGCGGAGC CGGTGGAGTC GGATTTCGGG CGGGCGTTGG CGCTGGCCGC CACGGCCCCG 
CTCGACGGGG TGGTGTCGGC GGTGTATCCG CTCACCCGGT GGCGGGAGGC GTTGGACCAT 
GCGTTGTCCG CGGGGCGTCT CGGCGCCGTG AAGATCGTTT TTGATCCGGC GGCGTCGGCG 
TGA

Protein sequence

MTRGLELYRS LPRYAAARVV SGRFPRLSGA AATTAAPLRL VDRGDPGLPG PGWVTVRPRL 
AGICGSDLAT VTGQSSFYFS PLVSMPFTPG HEIVGDLQEA VTLADGRRLD AGARVVIDPV 
LGCAARGLEL CVGCAAGRTS RCDRITVGHL APGLQTGFCA DTGGGWSRAL VAHHSQLHPV 
PDTLPDSRAV LVEPLATAVH TAGRCGVRSG DRVLIIGSGA VGLLTLLAIR AYTKAEHVTM 
VAKHRRQVEL ARRFGADEVL APDDAVGGVR RANRALRLTP QLGGEYLLGG VDVAIDCAGS 
ASSLSTALRV TRAGGRVVLS GVPAGSVDLT PLWFRELELV GTYASSGGAR PGRAGTEPAG 
PAEPVESDFG RALALAATAP LDGVVSAVYP LTRWREALDH ALSAGRLGAV KIVFDPAASA