Gene Franean1_1259 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1259
Symbol
ID	5669672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1516337
End bp	1517812
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	73%
IMG OID	641240191
Product	major facilitator transporter
Protein accession	YP_001505619
Protein GI	158313111
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0884652
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0333983
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCGTT CGGACCAGGT CACGTCGAGG ACGAGCGCAG GAAGCGCGGA GGAGGCAGGC 
ACCCGGGTGC CGTCGTCCAC TGGCACCTTC GCCGCCCTCC AGGTACCGAA CTTCCGCCTC 
TTCCTCGGCG GTCAGGTGGT CTCGCTGTGC GGGACCTGGA TGCAGATGAT CGCCCTGGGC 
TGGCTGGTGC TGTCACTCGG CGCGTCCGGC ACCGAACTCG GGCTCGTCAC CGCGGCCCAG 
TTCCTGCCCG TGCTGCTGTT CGGCGCCTAC GGCGGGCTGA TCGCCGACCG CTCGAACACC 
CGCAGGCTCC TGATCACCAC TCAGATCATT CTCGGTTCCC TCGCCGTCCT GCTCGGCATC 
CTGGACCTGA CGGGCACGGC ACGCCTGTGG ATGGTCGCCG CCGTCGCCGC GGCGATCGGG 
ATGACCAGCG CGGTGGACAA CCCGGCGCGG CAGAGCTTCG TCCAGGAGAT GGTGGGATCG 
GAGTTCCTGC CCAACGCCGT CACGCTGAAC TCGGTGACCA TGAACGCGGC CCGGGTCGTC 
GGGCCCGGCA TCGCCGGCAT CCTCATCAGC CTGGTCGGCA CCAGCGGCTG TTTCCTGCTG 
AACGGCGCCT CGTTCGTCGC CGTGGTCATC GCGCTCCAGC GGATCGACAC CGCGGCGCTG 
GTGCGCCGGC ATCCCGTGCC GCGGGCACCG GGGCAGGTGC GCTCCGGGCT CGCCTACGCG 
ATGCGGACGC CGAGCCTGCG TATCCCGCTG CTCATGATGG CCGTGATCGG AGCGTTGTCC 
TACGAGTTCC AGGTCGTGCT GCCGCTCGTG GCACGTGAGA CCTTTGGCGG GTCGGCCGCG 
ACGTACAGCC TTCTCACCGG CGCGATGGGT GCGGGGGCCG TGGCCGGTGG CCTGGTCGTC 
GCCCGGCACC GGCGGGTGGG GGTCCCGGCT CTGGCGGTCA CCTCCGGGGT GTTCGGCGTG 
GTCACCCTGG TGGCAGCCGC GGCCCCGGTG CTGGCGCTGG AGGTCGCCGC GCTCGTGGTG 
GTCGGCGCGG CGAGCGTCGC GTTCATCTCC ACCGGCAACG CGACCGTGCA GCTCTCCGCG 
GCACCGGAGA TGCGTGGCCG GGTGATGGCC CTGTGGTCGG TGGCGTTCCT CGGCTCGACC 
CCGGTCGGCG GCCCGATCGC GGGCTGGGTG TCCGAGACGT TCGGTGCGCG GGCCGGCCTG 
GCGATGGCCG GCGCGGCGGC GTTGGCCGGA TCCGCCTTCG CGGCGGCGTC CCTGCGCAGC 
CGGGCCGCGC GCACCCAGGC GGTCCCGGCG GCTGCGGCCA TCTCCCGGCC ACCGGCCGCG 
CCAGCCGGCG ACCCAACACC CGCCACCGCC AGCGACCCGG CGGCCGCCAC GGCGACCGAC 
ACCGCGCTCG GCAACCCGGT GGAGGCGGTG CTGAGCGCCG CGAACGCCGC TGCCGCACCG 
ACACCGAAAC ACGGACCGGC CCTACAGGAC GTCTGA

Protein sequence

MSRSDQVTSR TSAGSAEEAG TRVPSSTGTF AALQVPNFRL FLGGQVVSLC GTWMQMIALG 
WLVLSLGASG TELGLVTAAQ FLPVLLFGAY GGLIADRSNT RRLLITTQII LGSLAVLLGI 
LDLTGTARLW MVAAVAAAIG MTSAVDNPAR QSFVQEMVGS EFLPNAVTLN SVTMNAARVV 
GPGIAGILIS LVGTSGCFLL NGASFVAVVI ALQRIDTAAL VRRHPVPRAP GQVRSGLAYA 
MRTPSLRIPL LMMAVIGALS YEFQVVLPLV ARETFGGSAA TYSLLTGAMG AGAVAGGLVV 
ARHRRVGVPA LAVTSGVFGV VTLVAAAAPV LALEVAALVV VGAASVAFIS TGNATVQLSA 
APEMRGRVMA LWSVAFLGST PVGGPIAGWV SETFGARAGL AMAGAAALAG SAFAAASLRS 
RAARTQAVPA AAAISRPPAA PAGDPTPATA SDPAAATATD TALGNPVEAV LSAANAAAAP 
TPKHGPALQD V