Gene Franean1_4243 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4243
Symbol
ID	5672598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5050990
End bp	5052504
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	72%
IMG OID	641243116
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_001508533
Protein GI	158316025
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.891003
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGTTT CCACCGACGT CGTCGGCGAC GGGCACCCGC CCGCCGCGGT CGGGTCACCA 
GGGGCGAGTA GCCAGCTCGA CCCGCGACGC TGGCTGGCGC TCAGCATCAT CGCGGTCGCC 
CAGCTCATGG TCGTGCTCGA CGCGTCGATC GTGACGATCG CCCTCCCGCA CGCCCAGAGC 
GACCTGGGCA TCTCCACCGC CAACCGGCAG TGGGTCATGA CCGCCTACAC CCTGGCGTTC 
GGCGGCCTGC TCCTGCTCGG CGGGCGCATC GCCGACTTCC TCGGACGCAA GAGGATCTTC 
ATCTGGGGGC TGGTCGGCTT CGCGGCCGCC TCGGCGCTGG GCGGCGCCGC CCCCAACGCC 
GAGTTCCTTT TCGCGGCCCG GGCCCTGCAG GGTGCCTGCG CGGCGCTCCT CGCCCCGGCG 
GCACTCTCCC TGATCACCGT CACGTTCACC GAGGGCAAGG AGCGCGCCCG CGCGTTCGGC 
GTCTACGGCG GGATCTCCGG TGGCGGCGCG GCGATCGGGC TCATCGTCGG CGGGCTGCTC 
ACCGAGTACG CGTCCTGGCG CTGGTGCCTG TTGGTCAACG TCCCGATCGC CCTCGCCACC 
GCCGCGGCCG CGCTGCCCAT CGTGCGGGAG AGCAAGGCCG AGGGCACGCC GAGCTACGAC 
ATCCCCGGCG CGGTGACCGT CACCACCGGC CTGCTCGCGC TCGTGTACGG GTTCACCGTC 
GCGGCCGACG ACGGCTGGGG CTCGGCGACC ACGATCGGCC TGCTCGCCGG CGCGGTGGCG 
CTGCTCGCGG TGTTCGTCGT GATCGAGATG CGCACGGCCG CCCCGCTGCT GCCGATGCGC 
GTGCCATTGG AGCGCAACCG AGGCGGCTCC TTCCTGGCGT CGCTACTCAT CGGCGGCGGC 
CTGTTCGCGA TGTTCCTGTT CCTCACCTTC TACTTCCAGT CGACGCTCGG GTACAGCGCG 
CTGCGCAGCG GCTTCGCCTT CCTCCCGTTC AGCGCGGGCA TCATCCTCTC GGCCGGTCTG 
GCCAGCCAGT TCCTCCCCCG GGTGGGGCCG ACGATACTAA TGATCATCGG CACCGCGCTG 
GCTGCCGGCG GGCTGGTCCT GCTTAGCCAG ATCGGGGCGG ACTCCAGCTA CGCGGGCCAC 
GTCCTGCCCG CCGAGGTCCT GATCAGCCTC GGGATGGGCC TCGCGTTCGT CCCGATGTCC 
AGCGTCTCCC TGCTGGGGGT CGCCGACCAC GACGCCGGTG TGGCGAGCGC GCTGGTCAAC 
ACCACCCAGC AGGTCGGCGG GTCACTCGGC GTCGCGCTGC TGAACACCGT GTACGCGACG 
GCGGTCTCGG ACTACCTGGG CTCGCACGGC ACCGGCGCGG CCGCGCAGCG GCAGGCGGCC 
ATCGAGGGCT ACACCACGTC GTTCGTATGG AGCGCCGTGC TCGTGGGGAT CGCCCTGGTC 
GCGGTGATCC TGCTGGTCCG TGCGGGCCGG GACGACGTCC CCGCGGTCGA CGGAGTGCCC 
GTCCACGCCG GATGA

Protein sequence

MTVSTDVVGD GHPPAAVGSP GASSQLDPRR WLALSIIAVA QLMVVLDASI VTIALPHAQS 
DLGISTANRQ WVMTAYTLAF GGLLLLGGRI ADFLGRKRIF IWGLVGFAAA SALGGAAPNA 
EFLFAARALQ GACAALLAPA ALSLITVTFT EGKERARAFG VYGGISGGGA AIGLIVGGLL 
TEYASWRWCL LVNVPIALAT AAAALPIVRE SKAEGTPSYD IPGAVTVTTG LLALVYGFTV 
AADDGWGSAT TIGLLAGAVA LLAVFVVIEM RTAAPLLPMR VPLERNRGGS FLASLLIGGG 
LFAMFLFLTF YFQSTLGYSA LRSGFAFLPF SAGIILSAGL ASQFLPRVGP TILMIIGTAL 
AAGGLVLLSQ IGADSSYAGH VLPAEVLISL GMGLAFVPMS SVSLLGVADH DAGVASALVN 
TTQQVGGSLG VALLNTVYAT AVSDYLGSHG TGAAAQRQAA IEGYTTSFVW SAVLVGIALV 
AVILLVRAGR DDVPAVDGVP VHAG