Gene Franean1_0437 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0437
Symbol
ID	5668860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	518334
End bp	519530
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	72%
IMG OID	641239369
Product	Bcr/CflA subfamily drug resistance transporter
Protein accession	YP_001504808
Protein GI	158312300
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00710] drug resistance transporter, Bcr/CflA subfamily

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATTCCG CACGCCGCAC CCTGCTCGTG CTCGGCTTCC TCGTCGCGCT CGGGCCGTTC 
ACGGTCGACT TCTACATTCC GGCGTTCCCG CTCGTCCAAG CCGACTTCGG CACGAGCGCA 
GCCGCCGTGC AGCTCACGCT GACGGCCACC ACCATCGGCT TCGCGCTGGG CCAGCTGGCC 
ATCGGCCCGT GGAGCGACAG CATCGGGCGG CGCCGGCCCC TGCTGGTGGC CACCGCCCTG 
CACGTGGCCG GCAGCCTGGG CGTCGCCGCG GCGCCCACCG TCGAAGTCAT GCTCGTCTTC 
CGGCTGCTGC AGGGCGCCGG AGCCGCCGGC AGCGGCGTCG TGGCCCTGGC CATGGTGCGC 
GACCTCTTCG ACGGTGCCCT GTTCGTGCGG ATGGCAGCCC GGCTCGCCGT GGTGACCGGG 
CTCGCGCCGG TTGTCGCACC TTTCGCCGGT TCGCTGATGC TGAGCCACAT GTCCTGGCGA 
GGCTTGTTCG TCTGCATCGC GCTCTACGGC TTGGCGGTGC TCGCCGTCGC GGCGTTCCTG 
GTCCGGGAGA CGGCCCCGTT GGTGCGGCGA GCGGGGGCGC CGCTCGGGCG TTACCGCGTG 
CTGGTGACGG ATCGCGGCTT CGTCGGCGCC GCCCTCGCCG GTGGTCTGCT GGTCTCCAGC 
GTCTTCACCT ACATGAGTTC GTCGTCGTTC CTCTTCCAGG AGACGTACGG CCTCTCCGCC 
CAGCGGTACA GCCTGGTCTT CGCGGCGAAC GCGGTGGGCT TCGTGATCGG GGCGCAGACG 
TCAGCGCGGC TCGTCACCCG GATCGGGCCG CGGCGGCTGC TCCGATACGT ACTGCCCTCG 
CTCGGCTTCC TCGGCTTCAC CCTGCTGCTC GCGGCATTCG CCGGCGAGAA CGTGGTGGTG 
GTGACCTTCG TGACGGCGCT CTACTTCCTC CTGGCAGGCG CCGTCGGGCC CTGCCTGCAG 
GTGATCGGCA TGGCCCCGCA CGGGGAGAGG GCCGGAACCG CCGCCGCGCT GATGGGCGCC 
GCGAACTTCG GCCTGGCCGG CGCGACCGCG CCGGTGGCCG GACTACTCGG CGTCGGCTCG 
ATCGGCCCGA TCGGCCTCGT CATGGGGCTG ACCATGACGG TCGCGGTGGT TGTCTTCCGG 
GTGTTGGCCC GCGACCGGCG CGAAGCGCGG GCCGGGGCGC CTTCGCCGGT CCCTTGA

Protein sequence

MNSARRTLLV LGFLVALGPF TVDFYIPAFP LVQADFGTSA AAVQLTLTAT TIGFALGQLA 
IGPWSDSIGR RRPLLVATAL HVAGSLGVAA APTVEVMLVF RLLQGAGAAG SGVVALAMVR 
DLFDGALFVR MAARLAVVTG LAPVVAPFAG SLMLSHMSWR GLFVCIALYG LAVLAVAAFL 
VRETAPLVRR AGAPLGRYRV LVTDRGFVGA ALAGGLLVSS VFTYMSSSSF LFQETYGLSA 
QRYSLVFAAN AVGFVIGAQT SARLVTRIGP RRLLRYVLPS LGFLGFTLLL AAFAGENVVV 
VTFVTALYFL LAGAVGPCLQ VIGMAPHGER AGTAAALMGA ANFGLAGATA PVAGLLGVGS 
IGPIGLVMGL TMTVAVVVFR VLARDRREAR AGAPSPVP