Gene Francci3_1997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1997
Symbol
ID	3903705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2346588
End bp	2347889
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	70%
IMG OID	637879333
Product	major facilitator transporter
Protein accession	YP_481100
Protein GI	86740700
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.314351
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACTC GAGACGCCGC CGACGCACCT GAAGTCGCGT CCCCTGCTGG TCGTAGCCGG 
CGGAACACGG CGCTGATTTT CGCCGCGACG CTCGCGTTCA CGCTGTCGCT GGCCGGGTCG 
GCGTTGAAGA ACACGATTCA AGTGGACTTC TCGCCGATCG CAGTGGACCT TGGTGTCAGC 
CGCGGGACGT TCGCCTGGTC GACGACGGTC TTCGCTGTGG TCATCGCGGT GGCGAGCCCG 
GTCGTCGGGG TGCTGGCCGA TCGGTTCGGC GGCGCGGCCG TGCTGGTCAG CGGAACGGTG 
CTCGCCGGTG CCGCCTTCCT GATCTGCGCG GCGGCGCCGG GGGTGTCGCT GTTCGCGTCC 
GTCTACGGCG TGCTCGGCGC CTTCGCCTTC ACGATGCTCT CGTACGTTCC ATTGGGAAAG 
CTTGCCAGCG AGCTGTTCAC CGCCCGCGGG GAGGGCCTGG CGTACGCGGT CATGACGAAC 
GGCCCGGCTG TCGGGTTCAT CGTGCTGGTG CCGCTGTGGG TGTGGCTCGG CGCGTTCGCG 
TCCTGGCGGG CCGTCTTCGT CGTCGCCGGT CTGTCGATGC TCCTCGTGCT GACCCCACTT 
GCGCTGCTGC TGTATCGGCT GTCCGGCCAG GACGAGCCGG CGCCTACGGC GACGCCGGGC 
ACACCCGGGA CCGCGGACGA CGCGCGGCTC GGCTTCGGGG ACCGGTTGCG GCTGGCAGCC 
GCCAACCCTG TGTTCCTGGC GCTGACCGTC GCGTTCACCG GCTGTGGGAT CACGATGGCG 
TTTGTCGACG TTCACCTGGT CACCGATCTG CACGAACATG GCATGAGCCC GGGTGTCGTC 
AGTGGCACCC TCGCCATGCT GGGCGTCTTC GAGATCCTTG GCTCACTGGC CGCCGGCCGA 
AGGTGTGACC GGGGCCGGGT CCGGCAGACC CTGCTTGTCG GTTACGCGCT GCGCGGCGGG 
GCGATGGTGC TCGTCGCCTT CGACGCGACC GTAACCGCCT CGCTGGCCTT CGGGGTCATC 
TTCGGGGCGA GCTATCTGGC GACGGTGGTC GCGACCACGC TGTGGATTGG CCGGGTGCTG 
CCCGAGGGCG CCCGGGCCAC CGGCCTCGGT CTGCTGTGGA CGCTGCACAG CATCGGCGCC 
GCTCTCTCCA GCCAGCTGGG CGCGCTGGTC GCCGACTCGT ACAACTCCTA TACGCAGGTC 
GCGATGGGCG AGGCGCTGCT GGTCGGGGTG TCGTTCCTGC TGATCGCCCG GCTGCCCGCG 
CCACGCCCGG CGGCCGTCCC CGCCGGCGCT TCCCGGCAAT GA

Protein sequence

MTTRDAADAP EVASPAGRSR RNTALIFAAT LAFTLSLAGS ALKNTIQVDF SPIAVDLGVS 
RGTFAWSTTV FAVVIAVASP VVGVLADRFG GAAVLVSGTV LAGAAFLICA AAPGVSLFAS 
VYGVLGAFAF TMLSYVPLGK LASELFTARG EGLAYAVMTN GPAVGFIVLV PLWVWLGAFA 
SWRAVFVVAG LSMLLVLTPL ALLLYRLSGQ DEPAPTATPG TPGTADDARL GFGDRLRLAA 
ANPVFLALTV AFTGCGITMA FVDVHLVTDL HEHGMSPGVV SGTLAMLGVF EILGSLAAGR 
RCDRGRVRQT LLVGYALRGG AMVLVAFDAT VTASLAFGVI FGASYLATVV ATTLWIGRVL 
PEGARATGLG LLWTLHSIGA ALSSQLGALV ADSYNSYTQV AMGEALLVGV SFLLIARLPA 
PRPAAVPAGA SRQ