Gene Franean1_7269 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_7269
Symbol
ID	5675570
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8873275
End bp	8875032
Gene Length	1758 bp
Protein Length	585 aa
Translation table	11
GC content	75%
IMG OID	641246106
Product	dehydrogenase catalytic domain-containing protein
Protein accession	YP_001511494
Protein GI	158318986
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.325123
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCATC GACAGTTCCG CCTCCCCGAT CTCGGCGAGG GGCTGACCGA GGCGGAGATC 
GTCCGGTGGC TGGTGGAGGT CGGCGAGACC GTGACGGTCA ACCAGCCGCT GGTCGAGGTC 
GAGACGGCCA AGGCGGTCGT CGAGATCCCG TCCCCGTTCG CGGGTGTGCT CGTCGAACGG 
CACGGCGAGG CCGGCACCGA GCTCGCCGTG GGCACGCCGC TGCTGACCAT CGACGAGCCG 
GGCGACGAGC CCGCGACCGG CCCGACGACC GGGTCAGTCA CCGGAGCTAC CGAAGCCACC 
GGCCAGGAGA CCACGCCGGG GGACGCCACT CGCAACGGCG CGGCATCCCT GCCCGTGTCC 
CGGACCGGAG AGGCCGCGGA CGTCCCAGGG GGGGCCGGCA CGGCCGACCT GTCACCGATG 
GCCGCCGGGC GCACCCCGAT GCTGGTGGGG TACGGCCCGC GCAGCGACTC CGGCCCGCGC 
CGCCGGCGGC GCCCCCGCAA CCCGGACGGC CCCCTGCCCG GCTCGACGAC GCCCGCGGCG 
ACCATCGCCG CCCCCGCGCC CGCCCCCGGC ACAGCGCCCA CTGCCAGCTC AGCGCCCAGG 
GCCATGGCAC CCGTCGTGTC GTCGGTGCCG GCCTCGGCGC CAGCCACATC CCCGGCGTCG 
GCCGCGGCCG GTGCGCCGGA CCGATCAGCC GTAGTGCCGA TCGGGGCAGC CCCGCGGCAT 
GGGCGCGTCG CGGCGAAGCC ACCCGTCCGC AAGCTCGCGC GTGATCTGGG TGTGGACCTC 
TCCACGCTCG CGGGCACCGG TCCCGCGGGC ACCATCAGCC GCGCCGACGT CGAAACCGCG 
GCGCGTCAGG CCACGCCCCC CGAGCCCGCG CCCGTCCCCA CCACCGCCAC TCCGACGACC 
CGCACTGGGC CGGTCCGTGT CCCTGGCGTT GTCCCTTCGT CCAACGGAAT CGACGGCCCG 
CGCCAGCCGG AACTGAACGG ACACGCGGCG ACCACACGGC GGGTGCCCGG AGCCATCCCA 
CCCGACGCCG GATTCAACGA CACCGACCGG ATCTGGCGGA TCCCCGTCAC GGGCGTGCGG 
CGCACCATGG CACGGGCGAT GGTGGCCAGC GTGTTCTCGG CCCCGCACGC CACCGAGTTC 
CTCAGCGTGG ACGTCACCGA GACGATGGCG GCCCGCGAGC GGATCGCCGC CCTGCCGGAC 
TTCGCCGGCA TCCGGGTCAC GCCGCTGCTG CTCGTGGCGA AGGCGCTCCT CACCGCCGTC 
CGGCGCCACC CAATGATCAA CTCGACCTGG GTGGGCGACA CGTCCGGGGA GAACGCCGAG 
ATCCAGGTGC ACGAGCGGAT CAACCTCGGC ATCGCCGTGG CCGGGCCGCG TGGCCTGGTC 
GTCCCGAACA TCCCGGACGC CGGATCGCGC GGCCTGGTCG ACCTCGCCCG CAGCCTGCAC 
TCCCTCACCG AGGCCGCGCG CGCCGACCGG CTGCGCCCGG CCGACCTCTC CGGCGGGACC 
ATCACCATCA CCAACGTCGG AGTTCTCGGG GTGGACACCG GGGCACCGGT CCTCAATCCC 
GGTGAGGCCG CGATCCTCGC CCTCGGCGCG ATCCGCCCGG CTCCCTGGGT GCACGAAGGC 
GAGCTGGCGG TACGGACGGT GGCCCACCTC GCGCTGTCCT TCGACCACCG CGTCGTGGAC 
GGCGAGCTCG GCTCGGCGGT CCTGGCCGAC GTCGCGGCCG TCCTCGCCGA CCCCGTCATC 
GCGCTCGCCT GGAGCTGA

Protein sequence

MTHRQFRLPD LGEGLTEAEI VRWLVEVGET VTVNQPLVEV ETAKAVVEIP SPFAGVLVER 
HGEAGTELAV GTPLLTIDEP GDEPATGPTT GSVTGATEAT GQETTPGDAT RNGAASLPVS 
RTGEAADVPG GAGTADLSPM AAGRTPMLVG YGPRSDSGPR RRRRPRNPDG PLPGSTTPAA 
TIAAPAPAPG TAPTASSAPR AMAPVVSSVP ASAPATSPAS AAAGAPDRSA VVPIGAAPRH 
GRVAAKPPVR KLARDLGVDL STLAGTGPAG TISRADVETA ARQATPPEPA PVPTTATPTT 
RTGPVRVPGV VPSSNGIDGP RQPELNGHAA TTRRVPGAIP PDAGFNDTDR IWRIPVTGVR 
RTMARAMVAS VFSAPHATEF LSVDVTETMA ARERIAALPD FAGIRVTPLL LVAKALLTAV 
RRHPMINSTW VGDTSGENAE IQVHERINLG IAVAGPRGLV VPNIPDAGSR GLVDLARSLH 
SLTEAARADR LRPADLSGGT ITITNVGVLG VDTGAPVLNP GEAAILALGA IRPAPWVHEG 
ELAVRTVAHL ALSFDHRVVD GELGSAVLAD VAAVLADPVI ALAWS