Gene Franean1_7154 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_7154
Symbol
ID	5675457
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8735572
End bp	8736627
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	69%
IMG OID	641245993
Product	alcohol dehydrogenase
Protein accession	YP_001511381
Protein GI	158318873
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG1063] Threonine dehydrogenase and related Zn-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0462629
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0194652
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAGCCG CTGTGCTGCG GGAGGGAGTC GTCGAGGCCC GGGTCATCGA CGACCCGGTG 
CCGGGGCCGG GCCAGCTGCT GGTGCGGTCG CTCGCGTGTG GGATCTGCGC GTCGGACATC 
CACTTCATGG ATCATCTGGA AGCGGGCGTC GACGATGACA GCGGGATGTC GACCTACGAC 
CGTGATGTCG ACATCGTCAT GGGTCACGAG TACTGCGCCG AGGTCGTCGA CTACGGCCCC 
GGCACCGAGC GGCGGATCCC CGTGGGCGCC CGGGTGAGCT CGCTGCCGGT GCTGTCCACG 
GCCACCGGGC GGAAGATCAT CGGGCAGAAT CCGGAGTCGC CCGGCGGGTT CGGTGAGTAT 
CTCCTGCTCG ACGAGGCCAT GACCCGGGTC GCGGTCTCCG AGCTCCCGAA CGAGATCGTG 
TGCATCGCGG ACGCGGTCTC GGTCGGCTTG TCGGCCGCCT CCCGAGCGCA GGTGACGGCG 
AAGGAGGTGC CGCTGGTCAT CGGCTGCGGG GCGATCGCTC TGTCCGTGAT CGCGCAGCTG 
AAGCGGCTGG GGGTCGGGCC GATCCTGGCG GTGGACTTCG TCGCCTCGCG TCGCGAGACC 
GCGCTGGCCA TGGGAGCGGA CGTGGTCATC GACCCCGCCG CGGTGTCCCC GTACCAGGCC 
TGGCGTGACG TGGCCTACGG GTCGCCCGAG GCGATGAGGG AACTGATGGC GGTCGCCGGC 
CTGCCGGGAT GCGTCGTGTT CGAGTGCGTC GGTATTCCCG GTGTCCTGGA TTCGATCATC 
AAGGGCTGCG AGCGCAACAC CCGGATCTTC TCGGTGGGAG GTCCGCCGGA AGGCGATCAC 
CTGCACACCC TCACCGCCAA GCGGAAAGGC ATCAACATCC AGTTCGGGGG CGGCCCGTCG 
ATGCAGCACT GGGACGAGGC ATTCGCGGCG GTCGGCTCGG GCGACCTCGA CGTCACACCG 
ATGCTCGGCC GAACCGTCGG GCTCGACGAC GTCGCCGAGG CGCTCAACGC CTCCCGCGAC 
GCCAACGGAC CCGTCCGCAT CGTCGTCGTG CCCTGA

Protein sequence

MRAAVLREGV VEARVIDDPV PGPGQLLVRS LACGICASDI HFMDHLEAGV DDDSGMSTYD 
RDVDIVMGHE YCAEVVDYGP GTERRIPVGA RVSSLPVLST ATGRKIIGQN PESPGGFGEY 
LLLDEAMTRV AVSELPNEIV CIADAVSVGL SAASRAQVTA KEVPLVIGCG AIALSVIAQL 
KRLGVGPILA VDFVASRRET ALAMGADVVI DPAAVSPYQA WRDVAYGSPE AMRELMAVAG 
LPGCVVFECV GIPGVLDSII KGCERNTRIF SVGGPPEGDH LHTLTAKRKG INIQFGGGPS 
MQHWDEAFAA VGSGDLDVTP MLGRTVGLDD VAEALNASRD ANGPVRIVVV P