Gene Franean1_6409 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6409
Symbol
ID	5674724
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7779067
End bp	7780803
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	71%
IMG OID	641245257
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_001510652
Protein GI	158318144
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.438631
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCAGTG ATCTGGGCAG CTTGGCGGGT CCGGAGGAGG CAGGGGAACC ACAGGAGGCA 
GGGGAGCTAC GAGCGGAAGG GGAAAGGGAA GGGATCCGAG GGGAGCCGGG TGGGCGATCC 
GTGCCATCCG GCTCGGCCGG GCCGCCGCAC ACCGGGCTGG TGTTCACGGT GCTCGTGCTC 
GGTGGCCTGC TCGTCGTTCT GGATATCACG ATCATCAATG TCGCGATCCG CACGCTGGCG 
GCGGATCTCG ATGCTTCACT GCCGGTGATC CAGTGGGTTT CGACGGGATA CACCCTGGCG 
CTGGCCGTGA CCGTGCCGAC GACAGCATGG CTGGTGGCAC GGTTCGGTTC CGGACGTGTC 
TACATGGTGG CCCTGAGTCT GTTCGTGCTG GGGTCGGTGC TCTGCGGTCT GGCCTGGAAC 
ATCGACGCGC TCATTGCCTT CCGGGTGGTG CAGGGGATCG GCGGTGGCCT GGTCAACCCG 
GTCGCGATGA CGATTGTGCT ACGGGCCACG CCGCCGGAGC GGCGCGGGCG CGCCATGGGC 
CTGTTGGGTC TGCCGGTGCT CGTCGGGCCG GTGATCGGGC CGACGCTGGG CGGCTGGCTG 
GTCGACATCT CCTGGCGGTG GATCTTCCTG GTCAACCTGC CGCTGGGCCT GGCCGCGCTC 
CTGCTCGCGA GCCGAGTCCT GCGCCCGGTC ACCGCGGCCG CGGGTGCCGT CCAGCGGGGC 
GGCACGCTTG AGAGTGCTGA CGGGCGGCTC GACGTCCCAG GGTTGGCGCT TGTCGCGCCG 
GGGCTGGCGC TGTTCGTCTA CGGGCTGGCG GAGAGCGGGC GGCGCGGGAC TGTGACCTCG 
GCAGGTGTGC TCGTGCCGGC GCTGGCCGGG CTCGCGTTGG CGGTGGTGTT CGTGGTTCGG 
GCCGCTCGGA TGCGCGCCCC ACTGGTCCAG GTTGCGCTGT TGCGGCTGCG GGCTGTCGCG 
TCAGGGACGG CGACGCTGGC GCTGTTCGCG GCGGCCTACT TCGGTTCGAT GTTCGTCCTG 
CCGCTTTACT GGCAGCTCGT GCGGGGGCTC AGCCCCGCGG AGACGGGGAT GCTGGCGATC 
CCGCAGGCGC TCGCTACCGG GGCTTCGCTG CAGGTGGCGA GCCGGATGGT CGACCGGGTT 
CCGCCTGCCC GCGTGGTGGG CTTCGGGATC GTGACGGCGT CCTGCGGGCT GATCACCGCG 
ACGCTGTTGC TCGGCGTTGA CACCCCGTAC TGGCAGATGG TGGTGGCGAT GTCCGTCATG 
GGGGTCGGCG CGGGCTCGAC GATCATGCCG ACGATCACGA CAGCGCTGCG GCATCTGAGT 
GACCGGGACG CGCCGTCCGG CAGCACGCTG CTGACCATCA CCAACCAGGT GAGTGTCTCG 
ATCGGAACCG CCCTGACCTC CGTCGTACTC GCGGCCGGCC TCACCACCCA GGGCGTGGCC 
GGTGCGGCCG GTGGCGGCGG CGAGGGCGTG CTGCCGACCG TGGTGGACGG CCCGGCCGCC 
GCCCGGCTTG CCGAGGCCTG CCAGGACACG CTGTTCGTGT CCGCCGCGCT GCTGGTCGCC 
GCGCTCGTCG TGGCGCTGAC AGCGATCCCG GGCGGTCCGT TCAGTGCTTC TCGACGTCGC 
CGGGTCCAGC CGCGTATCCG TGCTCCTCGA CGTCGCCGGG TTCGGCCTCG CGGGGAGGCG 
CAGGATCAGT CGCCGGTTCG AGCAGCGCGG ACAGGCGATC TGACTCCGCC GCGGTGA

Protein sequence

MSSDLGSLAG PEEAGEPQEA GELRAEGERE GIRGEPGGRS VPSGSAGPPH TGLVFTVLVL 
GGLLVVLDIT IINVAIRTLA ADLDASLPVI QWVSTGYTLA LAVTVPTTAW LVARFGSGRV 
YMVALSLFVL GSVLCGLAWN IDALIAFRVV QGIGGGLVNP VAMTIVLRAT PPERRGRAMG 
LLGLPVLVGP VIGPTLGGWL VDISWRWIFL VNLPLGLAAL LLASRVLRPV TAAAGAVQRG 
GTLESADGRL DVPGLALVAP GLALFVYGLA ESGRRGTVTS AGVLVPALAG LALAVVFVVR 
AARMRAPLVQ VALLRLRAVA SGTATLALFA AAYFGSMFVL PLYWQLVRGL SPAETGMLAI 
PQALATGASL QVASRMVDRV PPARVVGFGI VTASCGLITA TLLLGVDTPY WQMVVAMSVM 
GVGAGSTIMP TITTALRHLS DRDAPSGSTL LTITNQVSVS IGTALTSVVL AAGLTTQGVA 
GAAGGGGEGV LPTVVDGPAA ARLAEACQDT LFVSAALLVA ALVVALTAIP GGPFSASRRR 
RVQPRIRAPR RRRVRPRGEA QDQSPVRAAR TGDLTPPR