Gene Franean1_4123 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4123
Symbol
ID	5672481
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4905158
End bp	4906624
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	70%
IMG OID	641242999
Product	major facilitator transporter
Protein accession	YP_001508416
Protein GI	158315908
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.625658
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCAAC CTGCCCGCAG AGCCCACCAC CAGGTCACGT TTGCCGTACT GGCGCTCGCC 
GTGGCCACCT ACGCCCTGCT GCAGTCACTG GTCACCCCCG TGCTACCCAC GATCATGGAA 
AGCCTGCACA CCAACCAGAC CACGGTCACC TGGGTGCTGA CCGCCTACCT CCTCTCCGCC 
TCGATCTTCA CCCCGATCAT GGGCCGCATC GGCGACGCCG TCGGCAAGAA GAAAATGCTG 
CTGGTCGCCC TCGGCGCACT CGCCGCGGGC TCCGCCCTGG CCGCGATCGC CACCGGCATC 
ACCCTGATGA TCATCGCCCG CGTCATCCAG GGTGTGGGCG GCGGCATCCT CCCGCTCGCC 
TTCGGCATCA TCCGCGACGA GTTCCCCCTG CCGAAGGTCT CCAGCGCCAT CGGCGTCCTG 
GCCGCGCTGA CCGCGGTCGG CGCCGGCCTC GGCCTCGTCC TGGCCGGCCC GATCGTCGAC 
CTGCTCGACT ACCACTGGCT GTTCTGGGTT CCCCTGATCA TGGTGCTGCT GGCCGCCGCG 
GCCGCCGTCG TGTTCATCCC GGAATCCGCC ATCCGCACCC CCTCCAGGAT CAGCATCACC 
CCGGCACTGC TGCTCTCCGC CTGGCTGGTC TGCCTGCTGC TCGGCCTCTC CGAAGGCCCC 
GACTGGGGCT GGACGTCCGG CAAGGTGCTC GGCCTGCTCG CCGGCGCCGT CATCATCGGC 
GGAGCGTGGG TCGTCGTCGA GACCCGCTCC ACCGCCCCAC TGATCGACAT GACCATGATG 
CGCCTGCCGG CCGTCTGGAC CACCAACCTC GTCGCCCTGC TCATCGGCGT CGGCATGTAC 
GCCCTCATGG CGTTCCTGCC GCAGTTCGTA CAGACCCCGA CCTCCGCCGG ATACGGCTTC 
GGCGCCACCA TCACCGAATC CGGGCTGATC CTGCTGCCGC TGAGCATCAC GATGTTCGCC 
GTCGGGATCG CTTCCGGCCC GCTGGCCGCC CGCTACGGAT CCAAGGCCGT CGTCGTCACC 
GGCTCCGCGG TCACAATCAT CTCCTTCGTC CTGACCGCCT TCGCCCACCA CGACAAGTGG 
GAGGTCTACA TCGCCACCGC GGTGATGGGC ATCGGGCTCG GCCTGGCCTT CTCCGCCATG 
GCCAGCCTCA TCGTCGAGGC CGTCCCGGCC CACCAGACCG GCGTCGCCTC CGGCATGAAC 
GCCAACATCC GCACCATCGG CGGCTCGATC GGCGCCGCAC TGATGGCCAC CATCGTCACC 
TCCGGCGCCG GAGGTGACGG CATACCCAAG GAATCCGGCT ACACCAACGG CTTCGCCATG 
CTCGCCGGCG CCACCGTGCT CGCCCTGATC GCCGCCCTCG CCATCCCGGC CGCCCGCCGG 
GGCCACCCGG CGACCGCCCA GGACCTGCCA CACGCCGAGC TGGGGCTGGT GCCCGGCGGC 
ACCCTGCTCG GCGCCGACCC GGAGTAG

Protein sequence

MIQPARRAHH QVTFAVLALA VATYALLQSL VTPVLPTIME SLHTNQTTVT WVLTAYLLSA 
SIFTPIMGRI GDAVGKKKML LVALGALAAG SALAAIATGI TLMIIARVIQ GVGGGILPLA 
FGIIRDEFPL PKVSSAIGVL AALTAVGAGL GLVLAGPIVD LLDYHWLFWV PLIMVLLAAA 
AAVVFIPESA IRTPSRISIT PALLLSAWLV CLLLGLSEGP DWGWTSGKVL GLLAGAVIIG 
GAWVVVETRS TAPLIDMTMM RLPAVWTTNL VALLIGVGMY ALMAFLPQFV QTPTSAGYGF 
GATITESGLI LLPLSITMFA VGIASGPLAA RYGSKAVVVT GSAVTIISFV LTAFAHHDKW 
EVYIATAVMG IGLGLAFSAM ASLIVEAVPA HQTGVASGMN ANIRTIGGSI GAALMATIVT 
SGAGGDGIPK ESGYTNGFAM LAGATVLALI AALAIPAARR GHPATAQDLP HAELGLVPGG 
TLLGADPE