Gene Franean1_6153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6153
Symbol
ID	5674474
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7486217
End bp	7487572
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	73%
IMG OID	641245005
Product	extracellular solute-binding protein
Protein accession	YP_001510403
Protein GI	158317895
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.916687
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCCGAT TCCGACGCGC GGTGCCGCTC GCCGTGGTGG CGGCGCTGTT CCCGCTGGCG 
GCCTGTGGCG GAGGCGGCTC GACGCCGGCC AGCCCGGGGG AGGGCCTGCG CCCGACCGCG 
CGCACCGCGG CCGCCGGCGT GGACGACGTC GAGGGCGCGA AGGCGTCCCC GCAGTGCGCC 
GCCCAGGTGA AGACGCTGCG GATGTACGCC GTGGGGAACC TGAACGACGT GGCGAAGTCC 
GGCAAGGCGT ACATGGAGAA GACGCATCCC GGCCTCACGG TCGAGATCGT CGCCACCGCG 
CCCAACTATG TGGCGCTGGT GCAGCAGCTC AGCGCGGACC GCTCAGCCCA CCAGCAGGTC 
GACGTCGCGG TCGCCGGCTT CGACGTGCTG CCGGTCTTCG CCGACCAGCT CGGCGCGCAG 
GAACTCTCCC CGCGGCTGCT GCGGGCCTCC TACGACCAGC GGATGGTCCC GCTCGGCCAG 
GTCGGCGGCC GCCAGGTCGG CATCCCCCAG CAGGTCTCGA CGCTGACGCT GGCCTACAAC 
CTCGACATCC TCGAGAAGGC CGGGGTCGAC CCGAAGACGC TGACCACCAC GGACGGTGTG 
ATCGCCGCCG CCGACAAGAT CAAGGCGTCC GGGCAGGACG TCCAGCCGAT CGACATCCCG 
ACCGGTCAGC AGTTCGGGCA GTGGGCGCTG AACACCCTCG CCAGCTCGAA GGGCGCGCCG 
ATCCAGGACG AGGCGGGCCG GCCGCGGCTG AACAGCCCGC AGGCGCTCGA GGCCGCCCGG 
TTCCTGGCGA AGGTCGGGAC GTACGGGCCG CAGTCCGACG ACCCGACCAA CCAGGGCCTG 
CTGCGGTTCG GCATCCGCAA GCAGACCGCG ATGACGATGG TGACGGTCGC GGCCCTCGCG 
GGCGGCCTGA AGTTCATCCA GGACCAGGGG GCGCAGGGCT TCCGGGCCGG CGCGGTGCCG 
TTCCCGACGC TGCCGGGCGG AAAGCAGGCG CCGGTCGCGG GCGGCAACGC GCTGACCGTG 
CTGTCCACCG ACCAGTGCCA GAAGGAGATG GCGACCGAGC TGGTCGTGTC GCTGCTGGCC 
CCCGACGTCG TGGCAGCGAG CACCGAGGCG CTGAGCTACC TGCCCGTGGA CACCGAGGCG 
CTGACCCGGC TGGAGCCGTT CTACCGCCAG TACCCGCAGC TGCTGCCGTT CAACGACCTC 
ATCCCGTCGC TGGTCGCGCC TCCGTCGTGG GGTGGCGCGC GCGGCGGCGA GCTCCCGACG 
GCCCTGTCCG ACCAGGTCGT GCGCATCATG ACCGGGGCGG ATGTCGACAA GACCCTCGCC 
GCGGCGCAGG CCGAGGCCGA GACCCTGACC CGGTGA

Protein sequence

MIRFRRAVPL AVVAALFPLA ACGGGGSTPA SPGEGLRPTA RTAAAGVDDV EGAKASPQCA 
AQVKTLRMYA VGNLNDVAKS GKAYMEKTHP GLTVEIVATA PNYVALVQQL SADRSAHQQV 
DVAVAGFDVL PVFADQLGAQ ELSPRLLRAS YDQRMVPLGQ VGGRQVGIPQ QVSTLTLAYN 
LDILEKAGVD PKTLTTTDGV IAAADKIKAS GQDVQPIDIP TGQQFGQWAL NTLASSKGAP 
IQDEAGRPRL NSPQALEAAR FLAKVGTYGP QSDDPTNQGL LRFGIRKQTA MTMVTVAALA 
GGLKFIQDQG AQGFRAGAVP FPTLPGGKQA PVAGGNALTV LSTDQCQKEM ATELVVSLLA 
PDVVAASTEA LSYLPVDTEA LTRLEPFYRQ YPQLLPFNDL IPSLVAPPSW GGARGGELPT 
ALSDQVVRIM TGADVDKTLA AAQAEAETLT R