Gene Franean1_0153 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0153
Symbol
ID	5668578
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	181053
End bp	182849
Gene Length	1797 bp
Protein Length	598 aa
Translation table	11
GC content	75%
IMG OID	641239082
Product	major facilitator transporter
Protein accession	YP_001504526
Protein GI	158312018
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0060166
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGAAGCCGG GAAGCACGCT CACCGAAGGA CTCAGCCGCC TGCGTGCGAC CATTCGCCGC 
GACGGCGCGC AACAGTCCGG GCTGTCCTCG CTGACCGAGT TGTCTTTCGT CAACGCGGCG 
GGCGACGCGC TCGTCACGGT GGCGCTGGCC GGCTCGCTGT TCTTCGCGGT GCCGACCGGC 
GAGGCCCGGT CCAAGGTGGC ACTTTACCTA CTGATCACGA TGGTGCCGTT CGCCCTGCTC 
GCACCGGTCG TGGGGCCGCT GCTGGACAGA GTGGCCTACG GGCGGCGCAC CGCGCTCGCG 
GCCATCTGCC TTGGGCGGTG CCTGCTGGCC TGGCAGCTGG CCGGCGCCCT GGACGGGCTC 
GCGGTCTACC CGCTCGCCCT CGGGCTGCTC GTCCTGTCGC GGGCGTTCGG CGTCGCCCGC 
AGCGCCGTCG TGCCGCGAGT CACGCCACCC GAGATGACCC TGGTCAAGGT CAACTCCCGG 
ATCTCCCTGG TCAACATCGT CGCCGGCGCG GTCGTCGCCC CGCTCGGCCT CGGGCTGGCC 
AACATCCCGT TCGTCGGCTA CCCGTGGGTT CTGCGGGTGT GCGCGCTGAT CTACATGGCC 
GGGGTGCTGC TGGCCTTCAA CCTGCCCGGC CACGTCGACT CCGCGGCCGG TGAGCGGACG 
CTGCGCGAGC TCACCGGCCC GCGCCGGCGG GGCAACCTGC GCACCCGGTT CGCCGCGGCG 
CTCGGCGCGC TGCCCGTCGC GTTGCGGGCG ACGCTGGTCC TGCGCGGACT GGTGGGCTTC 
CTCACCTTTT ACCTGGCATT CCTGCTGCGG ACGAACGGCG GCAACAACCT GTGGCTCGGC 
GCCCTCGCGG CGACGGCGGG ATTCGGCAGC GGAATCGGCG TCCTCATCGG CGGGCGGCTC 
GGGCGCCGGC GTCCCGAGGG AATTCTCATG CTGGGCCTGC TGCTGGCGGC GAGCGGATGC 
CTCGTCGCCG CGGTGACGTA CACCCGGTTC ACCTCGCTGG TCGCGGCCCT GCTGGCGATG 
ACGGCGGGCT CGATGGCCAA GCTGGCGCTG GACGCCATAA TCCAGCGCGA CATCGTCGAG 
GACACCCGGG GCTCGGCCTT CGCCCGCTCC GAAACGGCGC TGCAGCTCGG CTGGGTGACC 
GGCGGCGCGT TCGGGCTGAT CGAGATGCCG GGCACGCTCG GCTTCGCGCT CGCCGCGGCG 
GCGGTCGGGC TGGCCCTCGT CCTGCAGTCC CGGGCGCTGC GGGAGGCCCG CCGCCAGGCC 
CGCGAGCGCC ACCGGCCCAC GGCCCGGGAG ACCACCGGCG CCAAGCCGCC GTGGCCGGGC 
CCGCAGGCAC CGGCGCAGCC GTCCGCGCCC GTCGCCGACA CCGTTCCCGC GCCGGCCGGC 
TACGCGACAA CCGGCTATGC GACAACCGAC CGCGCTGTCG CCGATCCCAC AGCGACCGAC 
CCCACCGCGG TCGGTCCCCC ACCGGTCAGC CCCGCGGGTG CGGGTGCAGT GCCCACGGGT 
TCCATGAACG GCTGGTATGC CCCCGATCCG CGGGCCGACG TCCCGGTCAG TTGGCGGGGG 
CCCGCCGGCG GCGGGCAGCG AGCCGGCGGC GATCCCGACG CTACGAACCC GCTGGGGCAC 
CCGCCCGTCC CCGGGCCGGC GGCGGCAGAG GGCCCGGGCG GCGCGTACGG CCCGGCACCG 
CAGCTGCACC ATGCCTACCA GCAGCCCACC CCCGCGGTGC CGCGGACGCT GGAGGATCCC 
GACCCTCCGA ACGGCTCCGC CCGCCGCGGT CGCTGGCGCC GCGACCGGCC ACGATAG

Protein sequence

MKPGSTLTEG LSRLRATIRR DGAQQSGLSS LTELSFVNAA GDALVTVALA GSLFFAVPTG 
EARSKVALYL LITMVPFALL APVVGPLLDR VAYGRRTALA AICLGRCLLA WQLAGALDGL 
AVYPLALGLL VLSRAFGVAR SAVVPRVTPP EMTLVKVNSR ISLVNIVAGA VVAPLGLGLA 
NIPFVGYPWV LRVCALIYMA GVLLAFNLPG HVDSAAGERT LRELTGPRRR GNLRTRFAAA 
LGALPVALRA TLVLRGLVGF LTFYLAFLLR TNGGNNLWLG ALAATAGFGS GIGVLIGGRL 
GRRRPEGILM LGLLLAASGC LVAAVTYTRF TSLVAALLAM TAGSMAKLAL DAIIQRDIVE 
DTRGSAFARS ETALQLGWVT GGAFGLIEMP GTLGFALAAA AVGLALVLQS RALREARRQA 
RERHRPTARE TTGAKPPWPG PQAPAQPSAP VADTVPAPAG YATTGYATTD RAVADPTATD 
PTAVGPPPVS PAGAGAVPTG SMNGWYAPDP RADVPVSWRG PAGGGQRAGG DPDATNPLGH 
PPVPGPAAAE GPGGAYGPAP QLHHAYQQPT PAVPRTLEDP DPPNGSARRG RWRRDRPR