Gene Franean1_4115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4115
Symbol
ID	5672473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4898328
End bp	4899734
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	74%
IMG OID	641242991
Product	major facilitator transporter
Protein accession	YP_001508408
Protein GI	158315900
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.976029
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGACC GGGGCGTCTC GCCCCCACGA CGCCGCGAGG CGTCCGGACG CGAGGTTCTG 
CTGATCGTCT GCAGTGGCGT GATCCTGGCG AGCCTCGACC TGTTCATCGT CAACGTCGCG 
CTGCCGCAGA TCGCCCACGA TCTCGGCGAG ACCGACCTGA GCCGGCTGTC GTGGGTGCTC 
AACGGCTACG CGGTCGTCTA CGCGGCGCTG CTCGTCTTCT TCGGACGGCT CGCCGACCGG 
TACCGCCGCG ACCTCGGCTT CCTGCTCGGC GTCGCGGTGT TCACGCTCGC GTCGGCGGCC 
TGCGCGGCGG CCACCACCGT CGACATGCTG ATCGGCTTCC GGCTCGTGCA GGCCGCCGGG 
GCCGCGCTGG TGACACCCAC CTCACTGGGC CTGGTGCTCG CGGCCCACGA ACCCGAGCGC 
CGTCAGGGCG CCGTGCGCAC CTGGACCGCC GTCGGCGGGA TGTCGGCGGC GATCGGCCCG 
GTCGTCGGCG GGCTGCTCGT CGCCGCCAGC TGGCGCTGGG CGTTCCTCGT CAACGTCCCG 
GTCGGCCTCG CGGCCCTCGT CGTCGGCTGG CGTCGGCTGC CGCGCCTGGC CGGCCAGCCG 
ACCGAGCGGC CCGACGCCGT CGGCGTGCTG CTGGCCACCG GCGGGGTCGG CCTGCTGACC 
GCCGGGCTGG TCCGGGGGCC GGACTGGGGC TGGTCCTCGG CGGCGCTGGT GGGATCCCTC 
GGCGGCGGGG TCGGCCTGCT CGTCCTGTTC GCCGTCCACT GCGCCACCAG CCGGAACCCG 
CTCGTGCACC CGTCCCTGTT CACCTCCCGG CACTTCACCG GCGCCTCGAT CGTCGCGCTG 
TTCTTCTCCG CCTCCTTCGG CGCGATGCTG CTGTCGATCG TGCTCTGGGA GCAGGGCCAG 
TGGGGATGGT CCGCGCTGCA GGCCGGCCTG GCCATGGCGC CTGGGCCGCT CATGGTCCCG 
CTCGTCTCGT TCGGCATCAC CGGCAGGCTG ATCACCCGCT ACGGGCCGGC GATCGTCATC 
GGGCTGGGCA GTGTCATCTT CGGCGGCGGG GTCGCCTGGT GGGCGCTCGC GATCACCACG 
GAGCCGGACT ACGTCTCCGG CGTGCTCGGC GGCATGGCCC TCACCGGGAT CGGCGTCGGC 
CTGACCCTGC CCACCATGAT GTCCACGGCC GCCGCGTCGC TGCCCCCGCA GTCGTTCGCG 
ACCGGCTCCG CGGTCGTCAA CATGGTGCGC CAGACCGGCA TCGCCCTGGG CGTCGCCGTC 
ACCATCGCGG TGCTCGGCGA GTCGTCGGTG GCCAGCGGCA TCCCGCTGCA CCTGTTCGCC 
CGGGTCTGGT GGGTCACCGC CGCCCTGTCG TTCGCCGGAA TCGTGCCCGC CGTGGCCCTC 
CTGCGCCGCC CCGCCCGCAC GGCTTGA

Protein sequence

MMDRGVSPPR RREASGREVL LIVCSGVILA SLDLFIVNVA LPQIAHDLGE TDLSRLSWVL 
NGYAVVYAAL LVFFGRLADR YRRDLGFLLG VAVFTLASAA CAAATTVDML IGFRLVQAAG 
AALVTPTSLG LVLAAHEPER RQGAVRTWTA VGGMSAAIGP VVGGLLVAAS WRWAFLVNVP 
VGLAALVVGW RRLPRLAGQP TERPDAVGVL LATGGVGLLT AGLVRGPDWG WSSAALVGSL 
GGGVGLLVLF AVHCATSRNP LVHPSLFTSR HFTGASIVAL FFSASFGAML LSIVLWEQGQ 
WGWSALQAGL AMAPGPLMVP LVSFGITGRL ITRYGPAIVI GLGSVIFGGG VAWWALAITT 
EPDYVSGVLG GMALTGIGVG LTLPTMMSTA AASLPPQSFA TGSAVVNMVR QTGIALGVAV 
TIAVLGESSV ASGIPLHLFA RVWWVTAALS FAGIVPAVAL LRRPARTA