Gene Francci3_1244 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1244
Symbol
ID	3903543
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1488854
End bp	1490533
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	71%
IMG OID	637878578
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_480351
Protein GI	86739951
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.198291
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCGC AGACCCAGGC GCCCGCCGCG GCGGGCGGGG GCATGACGGG CGGTAGCGGA 
GATCGGCTCG ATCCGGCGCT GATCCGTCTC GCCGGGATCG TCCTCGTCGG TGCGGTCGTG 
GTGCAGCTCG ATGCGACGAT CACCTCCGTG GCGATCAACA CCCTCGCCCG ATCCTTCAAC 
GTCGGAATCT CGACAATCCA GTGGGTGAGT ACCGGTTACC TGCTCGCGCT CGCCATGGTG 
ATCCCGGTGA CCGGCTGGTC AGCCGAGCGG TTCGGCGCCA AGCGGATGTG GCTGCTGTCG 
CTGGTCCTGT TCCTCGTCGG CTCGGCGCTG TGTGGGGCGG CATGGTCGGC CGGCAGTCTC 
ATCGCCTTCC GGATCGTGCA GGGCCTCGGC GGCGGCCTGC TTCTGCCTCT GATGCAGACG 
ATCATCGCGC AGGCGGCCGG GCCGGAACGG CTGGGCCGCC TGATGGCGGC GGTGGGGGTG 
CCCGCGCTGG TCACTCCCGT GCTCGGGCCG GTCATCGGCG GGCTGATCGT CGACGATCTC 
GACTGGCGTT GGATCTTTTT CATCAACGTG CCGGTCTGCC TGATCGGGCT GGTCCTGGCC 
TGGCTGGGGA TGCCGGATGT GCGGACTCCC GGGCGGCATC GCTTCGACGC TCTCGGGTTC 
GCGTTGCTGT CCCCGGGGCT GGCCGCGATC GTCTACGGCT TCTCCGTGGC CGGCCGGCAG 
GGTGACTTCA CGGGTGTGCG GGTGATCGTG CCGCTGGCCC TCGGCGCGGC CCTGCTCGTT 
CTGTTCACGG TGCATGCCCT GCGGACCGCC GTCGAACCGA TCATCGACCT GCGGCTGTTC 
CGGTCCCGGG CCTTCGCCGG TTCATCGGGG ATGATGTTCC TGTTCGGGAT CTCGCTGTTC 
GGGGCGATGT TCCTGCTGCC CCTGTACGAG CAGCAGGCCC GTGGCCGCAG CGCCGCCGCC 
GCCGGCCTGC TCCTCGCCCC GCAGGGGTTG GGGATGATGA TCGCCCTGAT TGTGCTGGGC 
CGGGTGGCGG ACCGGCGCAG CCCGCGGTTG TTCGTTCTGG TCGGCCTTCT GCTCAGCGCG 
CTGGGATCGG TTGCGTATAC ACAGGTCGCC GCCGACACCA GCGAGGTGCT GCTCGGGGTC 
TCCCTGACGG TCCGCGGCAT CGGGCTGGCC ATGGCGCTCA TCCCGGTGAT GTCCTCTGCC 
TACCACGGGC TGCGCCGGGA GGAGATTCCG CGCGCCACCT CCGCGGGGCG GATCTTCCAG 
CAGATCGGCG GCTCACTCGG GACGGCCATC CTCGCCGTGG TGCTGTCCCA CCAGATCACC 
GGCCGACCCG CCGGGACCGG ACCCGCCGAT CCGGTGGCGC TGGCCGGCGC CTTCGGTACG 
GCGTTCTGGT GGACCCTCGG GTCCACGGTC CTCGCCGCAC CGTTCGCCTT TCTGCTGCCG 
GGACGGCCAG CCGGCGCGGA GCAGCCCGCC CCGTCAGGCC CGCCGGTCGA GCTCCCGCGG 
CCGGCCGGGG CCGTCCCCAC CCGTCGCCGG TCGGGCGACC ACGGGGAGCT GAAGAGCCAT 
GAAACTTCTC CCGGCCGCCG CGCCGCCGTC TCAGGGGCCG AGGGGAACCG CCACGATGGT 
CGGGAGTACC GGGTCCCCGC TCCCCGTGGC GGCCGAGGCG GTGGCCAGTG GCGCGGATGA

Protein sequence

MAAQTQAPAA AGGGMTGGSG DRLDPALIRL AGIVLVGAVV VQLDATITSV AINTLARSFN 
VGISTIQWVS TGYLLALAMV IPVTGWSAER FGAKRMWLLS LVLFLVGSAL CGAAWSAGSL 
IAFRIVQGLG GGLLLPLMQT IIAQAAGPER LGRLMAAVGV PALVTPVLGP VIGGLIVDDL 
DWRWIFFINV PVCLIGLVLA WLGMPDVRTP GRHRFDALGF ALLSPGLAAI VYGFSVAGRQ 
GDFTGVRVIV PLALGAALLV LFTVHALRTA VEPIIDLRLF RSRAFAGSSG MMFLFGISLF 
GAMFLLPLYE QQARGRSAAA AGLLLAPQGL GMMIALIVLG RVADRRSPRL FVLVGLLLSA 
LGSVAYTQVA ADTSEVLLGV SLTVRGIGLA MALIPVMSSA YHGLRREEIP RATSAGRIFQ 
QIGGSLGTAI LAVVLSHQIT GRPAGTGPAD PVALAGAFGT AFWWTLGSTV LAAPFAFLLP 
GRPAGAEQPA PSGPPVELPR PAGAVPTRRR SGDHGELKSH ETSPGRRAAV SGAEGNRHDG 
REYRVPAPRG GRGGGQWRG