Gene Franean1_1596 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1596
Symbol
ID	5669999
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1907271
End bp	1908248
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	74%
IMG OID	641240515
Product	transketolase central region
Protein accession	YP_001505941
Protein GI	158313433
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0994447
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGCAGG CGCTCAACGC CGCGCTGCGC GACTCGCTGC GGGCGGATCC CGACGTCCAC 
GTGCTCGGTG AGGACGTCGG TGCGCTCGGC GGCGTGTTCC GGGTCACCGA CGGCCTCGCC 
GCCGAGTTCG GGACGCAGCG CTGCCTGGAC ACCCCGCTGG CCGAGGCGGG CATCCTCGGC 
ACCGCGGTGG GCATGGCGAT GTACGGGCTG CGGCCCGTCG TCGAGATGCA GTTCGACGCC 
TTCGCGTACC CGGCGTTCGA GCAGCTCGCG TCGCACGTGG CGAAGATGCG CAACCGCACC 
GGCGGGGCGG TGTCGCTGCC GGTGACGATC CGTGTCCCGT ACGGCGGGGG CATCGGCGGC 
GTGGAGCATC ACAGCGACTC CAGCGAGGCG TACTACGCGC ACACCCCCGG GCTGCACGTG 
GTCACCCCCG CCACCGTCAC CGACAGCTAC GGTCTGCTGC GCGCCGCGAT CGCGTCGGAC 
GACCCGGTCG TCTTCCTGGA GCCCAAGCGG CTCTACTGGT CCACCGAGGA CGGGCTCTCC 
CCCGCAGAGG TCGCCCGCGC CGAGGTCGGG CCGATCGGAC GGGCGGCCGT CCGCCGGCCC 
GGCACCTCGG CGACGCTGCT GACCTACGGC CCGGCGCTGC CGGTGTGCCT GCGGGCCGCC 
GAGGCCGCGG TCGCGGAGGG CTGGGACCTG GCGGTCGTCG ACCTGCGCTC GCTGGTGCCC 
TTCGACGACG AGACGGTCTG CGCGGCGGTC CGGGCCACCG GGCGCGCGGT CGTGGTGCAC 
GAGGCCGCGG GTTTCGGCGG CGTCGGCGCG GAGATCGCCG CCCGGGTCAC CGAACGGTGC 
TTCCACCACC TGGCCGCCCC GGTGCTGCGG GTCACCGGGT TCGACATCCC GTACCCGCCG 
CCGATGCTCG AGCATCACTA CCTTCCCAGC GTCGACCGCG TCCTCGACGC CGTCGCCCGA 
CTCCAGTGGG AGCAGTGA

Protein sequence

MVQALNAALR DSLRADPDVH VLGEDVGALG GVFRVTDGLA AEFGTQRCLD TPLAEAGILG 
TAVGMAMYGL RPVVEMQFDA FAYPAFEQLA SHVAKMRNRT GGAVSLPVTI RVPYGGGIGG 
VEHHSDSSEA YYAHTPGLHV VTPATVTDSY GLLRAAIASD DPVVFLEPKR LYWSTEDGLS 
PAEVARAEVG PIGRAAVRRP GTSATLLTYG PALPVCLRAA EAAVAEGWDL AVVDLRSLVP 
FDDETVCAAV RATGRAVVVH EAAGFGGVGA EIAARVTERC FHHLAAPVLR VTGFDIPYPP 
PMLEHHYLPS VDRVLDAVAR LQWEQ