Gene Franean1_3555 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3555
Symbol
ID	5671924
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4218201
End bp	4219784
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	73%
IMG OID	641242441
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_001507861
Protein GI	158315353
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.21248
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAAT GGCTGACCCT GATCACGGTC TCCCTGAGCA CCTTCATGCT GCTGCTCGAC 
GTCACGATCG TCAGCGTCGC GGTGCCGGCG ATGGCCCGCG CGCTCGACTC CTCATTCACT 
GATCTGCAGT GGACCGTCGA CATCTACGTC CTGGTGCTCG CCGCGCTTCT GATGGCGATC 
GGGTCGGCGT CCGACCTCCT CGGCCGCCGC AAGGTCTTCC TGCTCGGGCT GGTCGTCTTC 
GCGGCGGCCT CCCTCGCCTG CGGGCTGGCC CCGAACACCG GCTTCCTCAT CGCCGCCCGG 
GGGGTGCAGG GGCTCGGCGC CGCGGCCATG TTCGCCACCA ACGCCGCGCT GCTCAGCGCC 
ACCTACCGCG GCCGCGACGT CGGTGTCGCC TTCGGGGTGT GGGGCGCGGT CAACGGCGCC 
GCCGCGGCGC TCGGCCCGAT CGTCGGCGGC CTGCTCACCG AGCACGTCAG CTGGCGGGCC 
ATCTTCCTGG TCAACCTGCC GGTCGCGCTG ATCGCCATCG TGATCGCCCT GCGCTCCGTC 
GCCGAATCGC GGGACCGGAT GAGCGGCCGG ATCGACATCC CCGGCACCGT CACGTTCACG 
CTCACCGTCT CGCTGCTCAT CTACGGCCTC ATCGAGGCCG GTGACAAGGG CTGGTCGGAT 
TCGGTCACCC TCGGGTGCCT CGCCGGCGCC GCCGTGGCCC TGGTGGTCTT CGTCCTGGTG 
GAACGGGGCC GGCGCGCTCC CATGCTCGAG CCGCGGCTGT TCCGCGGCCC ATCGTTCTCC 
GCGCTCATGG TCGGCGGCTT CGTGCTGACC GGGGCAGCCT TCGCGAACCT GGTGTTCGTG 
TCGGTGTGGG CGCAGACCGT CCTCGACTTC GACCCGGTGA AGGCCGGGCT CGTGCTCACC 
CCGTTGGCGG GGGTCTCGTT CGTGGTCGCC GGCGCCGGCG GCCGGCTGCT GCACGGCGTG 
CCGCCGAGGT ACTCGATCGG GGCGGGCCTG CTGCTGGTCG GGGTCGGTAC GTTCCTCGAC 
ATGATCATCG CTCCGTCGTC GGGATGGACC GCGCTGCTGG CCGGACTGAT CGTCACCGGC 
GTCGGGGTGG GGCTGGCCTC GCCGGCGCTC GCCTCCGCAG CGCTCACCAC GGTGCCCCCC 
GAGCGCGCGG GGATGGCCAA CGGCGCCATG AACACGTTCC GCCAGCTCGG GTTCGCCGTC 
GGCATCCCCG TCTTCGGCAC GGCCCTGGCC GGGCAGGCCC GGGCCAGCCT CAGCGACAGC 
GGCCAGTTCG ACGACCCGCA GGCCACCGCC AGCGCGCTGT CCGGCGGCGG CGCGCCGGAG 
ATCATCGCCC ACGTCCCCGC GGCCGCTCGC GCCGCGGTCG ACCAGGCCCT GCACGCCGCG 
TTCGCCGCCG GCCTCGACCG TGTCTTCCTG ATCAGCGGCA TCGCCGGGGT GGTAGCCGGT 
GCCGTGGTGC TGCTGCTCGT CCGACCGGAA CAGGCGGCCG CCCGCGCCGC GGCGGACGAC 
GGCCCGGCGG ACGCGGTGCC CGGAGGCCCC GCGATCCCGT CGCCCGGGGA CGGCAGCCAG 
GTGCCGACGG GGGCGAACGG CTGA

Protein sequence

MRKWLTLITV SLSTFMLLLD VTIVSVAVPA MARALDSSFT DLQWTVDIYV LVLAALLMAI 
GSASDLLGRR KVFLLGLVVF AAASLACGLA PNTGFLIAAR GVQGLGAAAM FATNAALLSA 
TYRGRDVGVA FGVWGAVNGA AAALGPIVGG LLTEHVSWRA IFLVNLPVAL IAIVIALRSV 
AESRDRMSGR IDIPGTVTFT LTVSLLIYGL IEAGDKGWSD SVTLGCLAGA AVALVVFVLV 
ERGRRAPMLE PRLFRGPSFS ALMVGGFVLT GAAFANLVFV SVWAQTVLDF DPVKAGLVLT 
PLAGVSFVVA GAGGRLLHGV PPRYSIGAGL LLVGVGTFLD MIIAPSSGWT ALLAGLIVTG 
VGVGLASPAL ASAALTTVPP ERAGMANGAM NTFRQLGFAV GIPVFGTALA GQARASLSDS 
GQFDDPQATA SALSGGGAPE IIAHVPAAAR AAVDQALHAA FAAGLDRVFL ISGIAGVVAG 
AVVLLLVRPE QAAARAAADD GPADAVPGGP AIPSPGDGSQ VPTGANG