Gene Franean1_5374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5374
Symbol
ID	5673708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6478539
End bp	6479984
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	71%
IMG OID	641244232
Product	major facilitator transporter
Protein accession	YP_001509638
Protein GI	158317130
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.558764
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAAAAT CTGCCCGTAG CGCCCTGACG CTGCTCGCCG GCACCCAGTT CCTCCTTATT 
CTGGACACGG CGATCATAAA TGTCGCGGCG CCGTCGATCG GGGACGAGTT CGACGTCTCG 
GCGGCGACTC TGTCCTGGGT GGCCAACGCC TATCTGGTGA CGTTCGGCGG GCTGTTGCTG 
CTCAGTGGTC GTCTGGCGGA CCTGTTCGGG CGCAGGCGGC TGTTCCTCAC AGGTCTGGCC 
GTCCTGGTCG CCGCGTCGCT GACCGGCGCG GTGGCGCAGA CGGCCTCGTG GCTGATCGCC 
GCCCGTGCGG TGCAGGGTGC CGGTGCGGCT CTGGCGGCGG CCGCGGCGTT CGCCCTGCTG 
CTCAGCCTGT TCCCAGACGG CCCCGACCGT CATCGGGCGC TGGGCGTGTT CGCGGCGATG 
GCCGGCGCGG GCGGCGCCGC GGGAACCGTG CTCGGCGGCG TGCTCACGAG CTGGTTGACC 
TGGCGGTCCA CGTTCGGGTT GAACGTGGTC GCCGGCCTCG TGCTCGTCGG GTCGGCCCTT 
CGGGCGCTGG CGCCGGACAC GCGTCCGTCG GCACGCCTCG GCTTCGACCT CGGTGGCGCG 
CTGTCCGTCA CCTCGGGGCT CGCGCTGCTC GCCTACAGCC TGGTGAACAC GGGGGTGGCC 
GGCTGGATCT CGCCGCGGAC CCTCGTACCC GGCGCGACGG CGGTGGTTCT CCTGGCGGTC 
TTCGTCTGGC TGGAGGGCAG GGTGCGCGTT CCCCTGGTTC CGGCCGCGGT CGTGCGCAGG 
CCGGTCCTAC GCCGGGCGAA CCTCCTCTCT GCGCTCGGGC AGGTCGTGCT CTTTCCGATG 
TTCTTCCTCG TCAGTGTGTA TCTGCAGGAT GTTCTCGGTT ACTCACCGGT CGCGGGCGGC 
AGCGCGCTGC TCCCGTTGTG CGTCGTGGTC ATTCTGGTGG CTTCCAACGC GGACCGGCTG 
ATCGGCGGCC TCGGGCTCCG GCCGGCGATG ACCGCGGGCT ATGTGCTCGT GGCCGTCGGC 
ATGGCGTGGC TGTCGCTGCT GTCTCCCGAT GGCTCGTTCA CCGGGGACAT CCTCCTGCCC 
AGCCTGATCC TCGGGGTCGG CCTTCCGCTG GTTGCCATCA CCACGAACGT CGCGGCGACC 
GCGGACGCCG GGCCGGAGGA GATCGGCCTC GCCTCCGGGC TGATCAACAC CAGCCAGCAG 
TTCGGCTCGG TCATCGGTCT GGCCGTGCTG AGCGGTATCG CCAGCGCGCG CGTCTCCGCC 
GAGGGCGGTC CGGACGATCC CGCGGCGCTC ACCAGTGGAT TCGCCGTCGC GTTCATCGTC 
GCCTCCGCCA TCGCGCTGCT GTCCGCCCTC TACGCGGCGG TGCCACGGAC GGCGAGACCA 
CAGCAGGAGC CGACCTGGGA AAGGCCACCG GTGTCGATGG CCGCACCAGG CGACAGGGAG 
AGCTGA

Protein sequence

MKKSARSALT LLAGTQFLLI LDTAIINVAA PSIGDEFDVS AATLSWVANA YLVTFGGLLL 
LSGRLADLFG RRRLFLTGLA VLVAASLTGA VAQTASWLIA ARAVQGAGAA LAAAAAFALL 
LSLFPDGPDR HRALGVFAAM AGAGGAAGTV LGGVLTSWLT WRSTFGLNVV AGLVLVGSAL 
RALAPDTRPS ARLGFDLGGA LSVTSGLALL AYSLVNTGVA GWISPRTLVP GATAVVLLAV 
FVWLEGRVRV PLVPAAVVRR PVLRRANLLS ALGQVVLFPM FFLVSVYLQD VLGYSPVAGG 
SALLPLCVVV ILVASNADRL IGGLGLRPAM TAGYVLVAVG MAWLSLLSPD GSFTGDILLP 
SLILGVGLPL VAITTNVAAT ADAGPEEIGL ASGLINTSQQ FGSVIGLAVL SGIASARVSA 
EGGPDDPAAL TSGFAVAFIV ASAIALLSAL YAAVPRTARP QQEPTWERPP VSMAAPGDRE 
S