Gene Franean1_3660 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3660
Symbol
ID	5672026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4336580
End bp	4338256
Gene Length	1677 bp
Protein Length	558 aa
Translation table	11
GC content	71%
IMG OID	641242543
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_001507963
Protein GI	158315455
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCGATC AAGCGCACGA AGCGGGGGCG GAGCCCGTCG AAGCCCTCGC GCCGGTCGAC 
GCCGCCGAGC CCGACGCCGC CGAGCCCGCT GCCACCGAGC CCGCTGCCAC CGAGATCGCT 
GCCACCGAGA TCAATGCCAC TGAGGTCGAT CCGGCGTTGC GCCGCCTCGC GCTCACGGTC 
ACCCTCGGCG CGATCATGGC CATCCTCGAC ACGACGATCG TGGCCGTAGC CATCAACACC 
CTCGGGCGGG ACTTCGACGC CTCGCTGTCG ACGATCTCCT GGGTGTCCAC CGGCTACCTG 
CTGGCACTCG CCGTCGTCAT CCCGCTGACC GGCTGGTCGG TCGAGCGGTT CGGCGCGACC 
CGGATGTGGA ACATCTCGCT GGTGCTGTTC CTGGCCGGCA GCGCGCTGTG CGGCGCCGCC 
TGGTCGGCCG GCAGTCTGAT CGTCTTCCGG GTGCTCCAGG GCCTCGGCGG CGGAATGATC 
ATGCCGATCT GCATGACCCT GCTGGCCAGC GCCGCCGGCC CGCAGCGAAT CGGCCGCGTC 
ATGAACATCG TCGGTGTGCC TGCGCTGGTC GCCCCGATCC TGGGCCCGGT CATCGGCGGT 
CTGCTCGTCG ACAACCTCGA CTGGCGCTGG ATCTTCTTCG TCAACCTGCC GATCGGCGCG 
GTAGCACTGG TCGCGTCATG GCGGGTGCTG CCGCGCGACG ACCGCGGGCA GTCGCACCAC 
CGGCTCGACG TCCCCGGTCT GCTGCTGATC TCGCCCGGCC TCGCGGCGCT CGTCTACGGC 
CTGTCCGAAG CCGGTTCGGG GGACGGCTTC GGAGCACTGA GGGTCCAGAT CAGCACCGCC 
GCCGGAGTGG TCGCGCTGGT GGCCTTCGTC GTGCACGCCC TGCGTCGCGA GGGCGCGCTG 
CTCGATCTCC GTCTGTTCGG CGACCGCACC TTCACCGTCG CCGGGGTCAC CACGTTCATG 
GTCGGCGCCG GCCTGTTCGG CGGGATGTTC CTGCTGCCGC TGTACTTCCA GGTCGCCCGC 
GGGCAGAGCG CGCTTGCCGC CGGCCTGTCG CTCGTCCCGC AGGGGGTGGG CGCGATGATA 
GGCATGCCGA TCGCCGGGCG GATCGCCGAC CGCCGCGGAG CCGGCTACGT CGTACCGGTC 
GGGATGGCCG TCTGCCTGCT CGGCACGGTC GCCTTCACGC AGGTCGACGC GCACACCAAC 
ACGGTCGCGC TCGGGGCGCT GCTGTTCGTG CGCGGCCTGG GCTTCGGCGC CTCGATGATG 
CCGGCGATGA GCGCCGCCTA CGTGACGCTC CGGCCCGCCG CTGTGCCGCG GGCCACCACG 
ACGCTCAACA TCCTGCAGCG GGTCGGTGGC TCCATAGCCA CCGCCCTGCT CGCGGTGGAG 
CTACAGCACG GGATCACCAG CCGGCTCCCC GGCTCGGGCG GCGGCATGCT GAACGCATCC 
GAAGGAACGG ACCTGCCCGC GACGGTCGCG GACAAGATCG CTCATGCCTT CGGCGCCACG 
TTCTGGTGGG TCGTCGGCCT GACCGTGCTC GGTCTCGTGT CCAGCATTTT CCTGCCCCGC 
CATGCCCCGA AGCCCACCGC CGCCCCCGAC GGGCATGCCG GGGATGGGGA GGACGAGCCG 
GCCGCGGAGG GAGAGCACGT CCCGGTCGGC ACTCCGGCAC CTGATCCAGC CGTGTGA

Protein sequence

MSDQAHEAGA EPVEALAPVD AAEPDAAEPA ATEPAATEIA ATEINATEVD PALRRLALTV 
TLGAIMAILD TTIVAVAINT LGRDFDASLS TISWVSTGYL LALAVVIPLT GWSVERFGAT 
RMWNISLVLF LAGSALCGAA WSAGSLIVFR VLQGLGGGMI MPICMTLLAS AAGPQRIGRV 
MNIVGVPALV APILGPVIGG LLVDNLDWRW IFFVNLPIGA VALVASWRVL PRDDRGQSHH 
RLDVPGLLLI SPGLAALVYG LSEAGSGDGF GALRVQISTA AGVVALVAFV VHALRREGAL 
LDLRLFGDRT FTVAGVTTFM VGAGLFGGMF LLPLYFQVAR GQSALAAGLS LVPQGVGAMI 
GMPIAGRIAD RRGAGYVVPV GMAVCLLGTV AFTQVDAHTN TVALGALLFV RGLGFGASMM 
PAMSAAYVTL RPAAVPRATT TLNILQRVGG SIATALLAVE LQHGITSRLP GSGGGMLNAS 
EGTDLPATVA DKIAHAFGAT FWWVVGLTVL GLVSSIFLPR HAPKPTAAPD GHAGDGEDEP 
AAEGEHVPVG TPAPDPAV