Gene Franean1_1507 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1507
Symbol
ID	5669911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1809518
End bp	1810891
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	73%
IMG OID	641240427
Product	major facilitator transporter
Protein accession	YP_001505853
Protein GI	158313345
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.0000169816
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

GTGTCCCACC CCCTTGCCGG ACCCGCCGAT CTTGCCAGTG ACGCCGATCC TGCCAGTGAC 
GCCGACGCCG ACGCCGACGC CGACGCCGAC GCCGTCACGG CACCGCGGGC GGGTGCCGTC 
GTGGCGGTTC TGGCGTTCGC CGGGATCGTG GTCGCGTCGA TGCAGAGCCT GGTGATCCCG 
CTGCTCCCCG AGCTGCCCGG GCTGGTGCAC GCGTCGGCGT CCGGGACGGC TTGGGCGATC 
ACCGCGACGC TGCTCGCCTC CGCCATCGCC ACTCCGGTGG CGGGCCGGCT CGGGGACATG 
TACGGCAAGC GGCGCATGCT GCTGGCCAGC CTCGGCCTGT TGGTGGTCGG CTCGGCCGCC 
GCCGGCCTGT CCACCACCCT GACCCCCCTG GTCATCGGGC GGACACTGCA GGGTCTGTCA 
GCCGGTGTCA TCCCGCTGGG GATCAGCATC ATGCGCGACG AGCTGCCGCC CGAGCGCCTC 
GGTTCGGCGA CCGCGACGAT GAGCTCCTCG CTCGGTGTTG GCGGCGCCCT GGGCCTGCCC 
GCGGCGGCCC TGATCGCCGA CCACACCGAC TGGCACCTGC TGTTCTGGAT CTCGGCGGGG 
CTGGGCGTCG TCGCCACGGC ACTCGTGCTG CGGCTGGTGC CGGAATCCCG AGCCCGCACC 
GGCGGGCGCG TCGACCTGGT CGGTGCGGCA GGGTTGTCGG CCGTGCTCGT GTGCCTGCTG 
CTGGCGATCT CCCAGGGGGC CGACTGGGGC TGGGCCAGCG GCCGCACCCT CGGCCTGTTC 
GTCGCAGGCG TCGCGGTCCT GCTGGCGTGG GGGCGCTGGG AGCTGCGCGC GCGGCAGCCG 
CTGGTGGACC TGCGCACCAG CGCGCGACGT CAGGTGCTGG TCACCAACCT CGCCTCGGTC 
ATGTTCGGTG TCGCCACGAT GCCGGTCCGG CTGGTGCAGC CCCAGATACT GCAGCTGCCC 
GCCGCCACCG GCTACGGGCT GGGGAAGTCG CTTCTGGTCA CCGGCCTGGT CCTGACCCCC 
ACGGGCCTGG TGATGATGGC CGTCTCACCG CTGTCCGCGC GTATCTCCGC CGCCAGGGGA 
CCGAAGACGA CCCTGATGGC CGGAGCCGTC GTGATCGCCG CCGGCTATGC GCTGGGCATC 
GGGCTGATGT CCGCCATCTG GCAGCTCATG ATGGTCACCA GCGTCATCGG CGCCGGGATC 
GGGCTCGCCT ACGGCGCCAT GCCGGCGCTC ATCATGGCGG CGGTTCCGAT CTCCGAGACC 
GGCGCCGCCA ACAGCCTCAA CAGCCTCATG CGGACCATCG GCGCGGCTCT GCTCGCCCTG 
GCCATCGCCA CGCTCGTACC CCGCCGTCGC CCGCTTGTGC ATGCCGACGC ATGA

Protein sequence

MSHPLAGPAD LASDADPASD ADADADADAD AVTAPRAGAV VAVLAFAGIV VASMQSLVIP 
LLPELPGLVH ASASGTAWAI TATLLASAIA TPVAGRLGDM YGKRRMLLAS LGLLVVGSAA 
AGLSTTLTPL VIGRTLQGLS AGVIPLGISI MRDELPPERL GSATATMSSS LGVGGALGLP 
AAALIADHTD WHLLFWISAG LGVVATALVL RLVPESRART GGRVDLVGAA GLSAVLVCLL 
LAISQGADWG WASGRTLGLF VAGVAVLLAW GRWELRARQP LVDLRTSARR QVLVTNLASV 
MFGVATMPVR LVQPQILQLP AATGYGLGKS LLVTGLVLTP TGLVMMAVSP LSARISAARG 
PKTTLMAGAV VIAAGYALGI GLMSAIWQLM MVTSVIGAGI GLAYGAMPAL IMAAVPISET 
GAANSLNSLM RTIGAALLAL AIATLVPRRR PLVHADA