Gene Francci3_0717 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0717
Symbol
ID	3903507
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	822803
End bp	824479
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	68%
IMG OID	637878050
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_479830
Protein GI	86739430
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.770491
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAGG CTCGATCAGC GGAGTCCGCC GAGCCCGTCG ACTCCGTGGA CTCCGTGGAC 
TCCGCCAGAA CCGGCGCCGG CACGTCTCCG GCGCCCCGCG GCGGCGCCGT GATCCCCTCG 
CCGGTCTCCG ACCAGCGCCG GCTCTGGCTG ATCATGGGAG CGCTGCTCCT CGGAATCCTG 
CTGGCCTCGC TGGATCAGAC GATCGTGTCG ACGGCACTGC CGACGATCGT CGGGGATCTC 
GGCGGCGCCA CCCATCTCTC CTGGGTGGTG ACTGCCTACC TGCTGGCCTC CACGGTGTCC 
ACACCGGTCT GGGGCAAGCT CGGTGATCTG TACGGCCGCA AGATCCTGTT CCAGGTGGCG 
ATCGTCATCT TCCTGGTGGG CTCGATGATC GCCGGTGCCA GTACGTCGAT GGGGCAGCTG 
ATCGCCTTCC GTGCCATCCA AGGGCTCGGC GGCGGCGGGT TGATCATCAG TGCGATGACG 
ATCATCAGTG ATCTCGTTCC GCCGCGCGAT CGAGGCCGTT ACCAGGGGCT GTTCGGCGCG 
ACGTTCGGTG TGTCGTCGGT GGTCGGTCCG CTGCTCGGCG GCCTGTTCGT CGACCATCTC 
TCCTGGCGCT GGGTCTTCTA CGTGAACCTG CCGGTGGGCG CGGTCGCCCT GGTGGTGACG 
GCGTTGGCGC TCCCGGCGAC GAGGAACCGC ATCAGGCACG TCATCGACTA CCTCGGCACC 
GTGCTCCTGG CCATGGCAAC GACCAGCCTC GTGTTGCTGA CCAGCCTGGG CGGCACCACC 
TACGCCTGGG GATCACCGGA GATCATCGGG ATGGGCGTCG CGGGAGTCGT GCTCCTCGTC 
GGGTTCGTGT TCGTCGAACG AGTGGCGGTC GAACCCGTGC TGCCGCTGAC GCTGTTCCGG 
GTCCGGGTGT TCTCGGTGGC CGGCGCGGTC GGCTTCGTCG TCGGCTTCGC GATGTTCGGC 
GCGATCGTCT TCCTGCCGCT GTTCCTCCAG GTGGTGAAGG GAGTCGACCC GACGGACTCC 
GGCCTGCAGA TGCTGCCGGT GATGGGTGGG CTGCTGCTCA GCTCGATCAT CTCCGGCCGG 
CTCATCAGCC GGTGGGGCCG TTACAAGATC TTCCCGGTCG TCGGTACCGC GATGATGTCG 
ATCGGCCTGT TCCTGCTGTC GTTCATCAGT CCCGACATCT CCACGCTGCA GCTCACGTTG 
TCCATGTTCG TCCTCGGGGT CGGGATCGGC GCGGTCCTGC AGGTCCTGGT CATGGCCGTG 
CAGAATGCCG TCGACTACCG GCAGATGGGC GTGGCCACCT CGGGTGCGAC CTTCTTCCGG 
TCCATCGGCG GGTCGTTCGG TACCGCCGTG TTCGGCGCGA TCTTCGCGAA CCAGCTCAGG 
GGTAACCTCG CCGAGCGGTT TGCGGGCATC CCGTTGCCAT CCGGTCTGTC CGCCTCCGGT 
TCCAACCTCA GCCCCCAGGT GCTCCACAGG CTGCCCCCGA CGATCCGGGA CGGATTCGTC 
CAGGCGTTCT CGGACGCGAT GCAGACCGTC TTCCTGGTGG CGGTGCCGAT CGGTCTGTGC 
GCCTTCGCGC TGGCCTGGTT GCTGCCCGAG ATCCGCCTGG GAAACACCGT CGGTGGCGCG 
CGGCCCGCGG CGCCGGGCTC GGCGAAGGCG GATGAGACCG CGGAGGTCCT CAAGTAG

Protein sequence

MTQARSAESA EPVDSVDSVD SARTGAGTSP APRGGAVIPS PVSDQRRLWL IMGALLLGIL 
LASLDQTIVS TALPTIVGDL GGATHLSWVV TAYLLASTVS TPVWGKLGDL YGRKILFQVA 
IVIFLVGSMI AGASTSMGQL IAFRAIQGLG GGGLIISAMT IISDLVPPRD RGRYQGLFGA 
TFGVSSVVGP LLGGLFVDHL SWRWVFYVNL PVGAVALVVT ALALPATRNR IRHVIDYLGT 
VLLAMATTSL VLLTSLGGTT YAWGSPEIIG MGVAGVVLLV GFVFVERVAV EPVLPLTLFR 
VRVFSVAGAV GFVVGFAMFG AIVFLPLFLQ VVKGVDPTDS GLQMLPVMGG LLLSSIISGR 
LISRWGRYKI FPVVGTAMMS IGLFLLSFIS PDISTLQLTL SMFVLGVGIG AVLQVLVMAV 
QNAVDYRQMG VATSGATFFR SIGGSFGTAV FGAIFANQLR GNLAERFAGI PLPSGLSASG 
SNLSPQVLHR LPPTIRDGFV QAFSDAMQTV FLVAVPIGLC AFALAWLLPE IRLGNTVGGA 
RPAAPGSAKA DETAEVLK