Gene Franean1_2074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2074
Symbol
ID	5670475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2498496
End bp	2499605
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	71%
IMG OID	641240996
Product	transaldolase
Protein accession	YP_001506417
Protein GI	158313909
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0176] Transaldolase
TIGRFAM ID	[TIGR00876] transaldolase, mycobacterial type

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.195671
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0887759
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAAGC CCCTGTCCGA CCTGTCAGCC GCCGGCGTGG CGGTGTGGCT GGACGACATC 
AGCCGCGAGC GGATCCGGAC CGGCAACCTC GCCGAGCTCG CCCGCACCCG CAGCGTCGTC 
GGCGTCACCA GCAACCCGAC GATCTTCCAG AAGGCCATCG GCGGCGGTGA GACGTACAAC 
GAGCAGCTCC GCGACCTGGC CGTTCGCGGG GTCGACGTGG GCGAGGCCGT CCGCGCGATC 
ACCGCGGCGG ACATCCGCGA CGCCTGCGAC ATCCTGCGGC CCGCCTACGA CGCCAGCGCC 
GGCGTCGACG GCCGGGTCTC CCTCGAGGTC GACCCGCGGC TCGCACACGA GACCGAGCGC 
ACGGTCGCCG AGGCCCGTGC CCTGTGGTGG TCGGTCGACC GGCCGAACCT GTTCATCAAG 
ATCCCGGCGA CGAAGTCCGG CCTGCCGGCC ATCACCGCGA CGCTGGCGCA GGGCATCAGC 
GTGAACGTGA CGCTGATCTT CGCGCTGGAC CGCTACGAGG CCGTCATGGA CGCGTTCATG 
ACCGGTCTGG AGCAGGCCCT CGCCGCCGGT CGGGACATCT CCGACGTGGC CTCTGTCGCG 
TCCTTCTTTG TCAGCCGCGT CGACAGCGAG GTGGACGGCC GGCTCGCGAA GATCGGCACG 
CCGAAGGCGG AGGCCCTGCG CTCGAAGGCC GCGATCGCCA ACGCCCGGCT CGCCTACGAG 
CTGTACGAGA AGATCTTCAG CACGCCGCGC TGGGAGCGGC TCGCCGCCGC CGGCGCGAAG 
CCCCAGCGCC CGCTGTGGGC CTCAACGTCG ACGAAGGACC CGGGGCTGCC GGACACCCTC 
TACGTGACGG AGCTGATCGC ACCGGGCACC GTCAACACGA TGCCGGAGGC GACGCTCGAG 
GCGTTCGCCG ACCACGGGGT CGTGCCCGGC GACACCATCA CGCCCAACTA CGAGGACGCC 
CGCGCCGTCC TGGCCGAGCT CACCGAGCTC GGAGTGGACA TGGCCGACGT CGTCGAGGTG 
CTGGAGGTCG AGGGCGTCCG CAAGTTCGAG GACTCCTGGA ACCAGCTCCT CGACACCATC 
CGCGAGCAGC TCGGCTCCGC CGCGTCCTGA

Protein sequence

MSKPLSDLSA AGVAVWLDDI SRERIRTGNL AELARTRSVV GVTSNPTIFQ KAIGGGETYN 
EQLRDLAVRG VDVGEAVRAI TAADIRDACD ILRPAYDASA GVDGRVSLEV DPRLAHETER 
TVAEARALWW SVDRPNLFIK IPATKSGLPA ITATLAQGIS VNVTLIFALD RYEAVMDAFM 
TGLEQALAAG RDISDVASVA SFFVSRVDSE VDGRLAKIGT PKAEALRSKA AIANARLAYE 
LYEKIFSTPR WERLAAAGAK PQRPLWASTS TKDPGLPDTL YVTELIAPGT VNTMPEATLE 
AFADHGVVPG DTITPNYEDA RAVLAELTEL GVDMADVVEV LEVEGVRKFE DSWNQLLDTI 
REQLGSAAS