Gene Franean1_3651 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3651
Symbol
ID	5672018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4327383
End bp	4328936
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	72%
IMG OID	641242535
Product	major facilitator transporter
Protein accession	YP_001507955
Protein GI	158315447
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCTCCA TCGAGAACAC CGGCCACCGC GGCTCGGCCA CCGGCCACCG CGCGGACGGC 
GCACTGCCCG TCAACGCGAT CATCGCCGTC CTGGGCGCCG TGGGCATCGT CGTCGCGATG 
ATGCAGACCC TGATGGTGCC GCTGATCCCG GTGCTGCCGT CGCTGCTGCA CACGCACGCG 
GCGGACGCAT CGTGGGCCAT CACGGCGACC CTGCTCGCCG CGTCGGTCGC GAACCCGGTG 
TTCGGGCGGC TCGGCGACCT CTTCGGCAAG CGGCGCATGC TGCTCGTCTC CGGGTTCGTG 
CTGGGCTGCG GCTCCCTGGT CTGTGCCCTG AGCGACACTC TGGTGCCGAT GGTCGTCGGC 
CGGGCGATGC AGGGCCTCGG GCTGGCGATC ATCCCGCTGG GCATCAGCAT CATGCGTGAC 
CTGCTGCCGG CGAAGCGGCT GATCCCCGCC ATGGCGCTGA TGAGCTCCTC GCTCGGGATC 
GGTGGCGCCC TGGGCCTGCC GCTCGCCGCC GCGGTCGCCC AGCAGACGAA CTGGCACGTG 
CTGTTCTGGG GCTCGACCGT GGCGGTCGCC CTGCTGATGG TCCTGGTGTG GCGGGTCGTT 
CCCGAGTCGC CGGTGCGCGG CACGGGCCGG TTCGACCTGC CGGGGGCGAT CCTGCTCTCC 
GGAGGGCTCG TCGCGCTGCT GCTCGCCGTG TCGAAGGGAA GCACCTGGGG CTGGACCAGC 
ACCACCACCC TCGGCCTGGG CGGAACGGCG GCCGCGCTCC TCGTCGCCTG GGCCTGGTGG 
GAGACCCGCG TCGAGGCGCC CCTCGTGGAC CTGCGCACCA CCATCCGGCG CCCGGTGCTG 
CTGACGAACC TCGCCTCGGT CATGCTCGGC TTCGCGATGT ACACGATGTC GCTGATCGGC 
CCGCAGCTGC TGCAGCTGCC GAAGGCCACC GGGCACGGGC TCGGCCAGTC GCTGCTCGCC 
ACCGGCCTGT GGATGGCCCC CGCCGGAATC GTCATGATGG CCGTCTCGCC CATCGCCGGC 
CGGCTGATCA CGGTGCGCGG CCCGAAGGTG GCGCTCCTCG CCGGCTCGGC CGTGATCTCG 
GCCGGCTACT TCCTCGCCAT CGGTCTCACC GGCAGCCCGC TGGGAGTCCT GCTCGTCAGC 
GTCGTGACCA GCGCCGGTGT CGGCCTGGCC TACGCCGCCA TGCCCACCCT GATCATGCAG 
GCCGTCCCGG CCTCGGAGGG CGCCTCGGCG AACGGTCTCA ACACCCTCAT GCGCTCCATC 
GGGACGTCCA CCGCGAGCGC GGTGATCGGT GTGGTCCTGG CGAACATGAC CGTCACCTTC 
GGCTCGACCC AGGTGCCGTC CCTCGCCGGT ATGCACATCG GATTCCTGAT CGGCGCCAGC 
GCCGCCCTCG TCGCCTGCCT GGTCGCCATC GCCATTCCCG GCCGCCTGGC CCCGACACCG 
GACGTCGCCT CGAAGCCCGA CGTGGCCCTG AAGCCGGACG TCGTTCTCCC GGCGCCCCGC 
CCGTCGTCGC CGCGGACGGC CGAGCCGGAG ACGGCAGCCG TCTCCGCCCG CTGA

Protein sequence

MASIENTGHR GSATGHRADG ALPVNAIIAV LGAVGIVVAM MQTLMVPLIP VLPSLLHTHA 
ADASWAITAT LLAASVANPV FGRLGDLFGK RRMLLVSGFV LGCGSLVCAL SDTLVPMVVG 
RAMQGLGLAI IPLGISIMRD LLPAKRLIPA MALMSSSLGI GGALGLPLAA AVAQQTNWHV 
LFWGSTVAVA LLMVLVWRVV PESPVRGTGR FDLPGAILLS GGLVALLLAV SKGSTWGWTS 
TTTLGLGGTA AALLVAWAWW ETRVEAPLVD LRTTIRRPVL LTNLASVMLG FAMYTMSLIG 
PQLLQLPKAT GHGLGQSLLA TGLWMAPAGI VMMAVSPIAG RLITVRGPKV ALLAGSAVIS 
AGYFLAIGLT GSPLGVLLVS VVTSAGVGLA YAAMPTLIMQ AVPASEGASA NGLNTLMRSI 
GTSTASAVIG VVLANMTVTF GSTQVPSLAG MHIGFLIGAS AALVACLVAI AIPGRLAPTP 
DVASKPDVAL KPDVVLPAPR PSSPRTAEPE TAAVSAR