Gene Franean1_3317 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3317
Symbol
ID	5671689
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3929447
End bp	3930442
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	69%
IMG OID	641242206
Product	transketolase central region
Protein accession	YP_001507626
Protein GI	158315118
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.589237
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGATGC GCGAGGCGTT GAACCTCGCC CTGGACCAGG CGCTGGAGCG TGACGAGCGC 
GTCTTCCTGA TCGGCGAGGA CATCGCCGAC CCGGGGGCGT CCGGCCCGAC CGCCGGGCTG 
TCGAGCAGGT ACGGCACCGA GCGGGTGCTG GACACGCCGA TCTCCGAGGC GGCGATCGTG 
GGCGCGGCCA TCGGAGCCGC GATGGAGGGC TTCCGTCCGG TGGCCGAAAT AATGATCATG 
GACTTCATCG GGATAGCCGC CGACCAGATC ATCAACCACG CGGCGAAGAT GCGGTTCATG 
ACCGGGGGGC GGACAACCGC GCCCATCACC GTGCGCACAC AGATCTACGG CGGACTCGGC 
ACCGGCGCCA CGCACTCGCA GTCGCTGGAG GCGTGGTTCA TGCACATTCC CGGGCTGAAA 
GTCATCGTTC CCTCGACGCC GCGCGACGGC AAAGGCCTGC TCACGTCCGC GATCTTCGAC 
GACGACCCGT GCATCTTCCT GGAGACGATC CGCCTGCAGG GCCAGCGTGG AATGGTGCCG 
GTCGACCCGG GATTCTCGAT CCCGCTCGGC CAGGCGGACG TGAAGCGCGC CGGCACCGAC 
GTCACGCTGA TCAGCTACGG CCGGGGGGTC GTCGAGTCGC TCGGCGCGGC GGACGCGCTC 
GCGCGCCAGG AGATCAGTGC CGAGGTACTC GATCTCCGTA CCCTCGTCCC GCTCGACACG 
GCGGCGATCG TCGAATCGGT GCGCCGGACG ACGCGAGCGG TGGTGGTGCA CGACGCCGTG 
CGGTTCGCCG GCCCCGGAGC GGAGATCGTC GCCATTCTCC AGGGCGAGCT CTTCGACCAG 
CTCGCGGCGC CGGTGGAGCG GGTGGGCGCC CGGTTCGTGC CGAACCCGGC CCCGCCGGCG 
CTGGAGTCGC AGGTGTACCC GGATTCCGAA AAGATCATCG CCGCCGTCCA CCGGACGCTG 
CGGTGGAAAA CCACCAGGGA AGGTGCCCGT GGCTGA

Protein sequence

MTMREALNLA LDQALERDER VFLIGEDIAD PGASGPTAGL SSRYGTERVL DTPISEAAIV 
GAAIGAAMEG FRPVAEIMIM DFIGIAADQI INHAAKMRFM TGGRTTAPIT VRTQIYGGLG 
TGATHSQSLE AWFMHIPGLK VIVPSTPRDG KGLLTSAIFD DDPCIFLETI RLQGQRGMVP 
VDPGFSIPLG QADVKRAGTD VTLISYGRGV VESLGAADAL ARQEISAEVL DLRTLVPLDT 
AAIVESVRRT TRAVVVHDAV RFAGPGAEIV AILQGELFDQ LAAPVERVGA RFVPNPAPPA 
LESQVYPDSE KIIAAVHRTL RWKTTREGAR G