Gene Francci3_4154 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4154
Symbol
ID	3907119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4954306
End bp	4955757
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	71%
IMG OID	637881482
Product	EmrB/QacA family drug resistance transporter
Protein accession	YP_483231
Protein GI	86742831
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGGC CCGAGGCCCA CTCCGGCTCC GCGGATGGAC CGAACCCGTC GAACGATCTG 
GAGCAGGCCG GTCCGAGTCT CGTGCCGCTG GCCACGACCC TGATCGTCGG GGCGTTCGCG 
GCCCTGCTCG ACACCACTGT CGTGGCGGTC GCGATCGACA CGCTGGGGCG CGACCTGCAA 
GCGGACATCA CGGTGATCCA GTGGGTCACG ACGTCCTACC TGCTGGCGAT GGCTGCCGTC 
ATCCCGGTGG TCGGCTGGCT GGTCGACCGG TTCGGCGCCC GCGCGATCTG GTCGGGTGCC 
CTCGGGCTGT TCCTGGCCGG ATCGGTGCTG TCAGGCCTGG CCTGGTCCGC TGGCGCGCTA 
ATCGCCTTCC GGGTGCTGCA GGGCCTGGGT GGCGGCATGA TCCTTCCGCT GACCCAGCTG 
GTACTCGCCC GGGCCGCCGG CCCGCAGCAC TTCGGGCGGG TCATGGGCGT CGTCGGCCTG 
GTCGGCCAAC TGGCGCCGAT CTCCGGCCCG GTGCTGGGCG GCCTGCTGAT CGACACCTGG 
GGCTGGCGGT GGATCTTCTT CGTCAACGTG CCGATCGTCG TGGTCTCGCT GCTCATGACA 
ACACGGTGGT TCCCCCGCGA AGACCCGCGC ACGGAGCGTT CCCTGGACGT GGTGGGCCTG 
GTCCTGCTGC CCACCGGCAT CGTGGCGATG ATCTACGCGC TGTCGAACGT CGAGTCCGGA 
AGCACGGTGG TGTCCGCACA GGTGCTCGTC GCCGCGCTGG TCGGCGTCGC GCTGCTGGCC 
GCCTTCGTCC TGCGGCCGAC GACACCAGGC CGGCCGTCGC TCATCGATCT ACGCCTGTTC 
GGCGACCGTT CCTTCCGCGG CGGCTCGGTG ATGCTGTTCG TCTTCGGCGT GACGAGCTGG 
GGCCCGATGT TCGTGCTCCC CCTCTACTAC CAGCAACTGC GGGGGCTGTC CGCACTTGAC 
GCCGGGTTCG CCCTCGCACC GCAGAGCGTC GGCCTGGGGC TTGCGTACCT CGCAACCGGC 
CGGTACGCCG ACCGGCTCGC GCCACGCCCG CTCGTGGCAG GGGGTCTGGT GGTCGCGAGC 
GCGGGCACTC TGCCGTTCGT CTTCGCCACC GCCGACAGCA ACCTGACCCT GCTTGGCATC 
TCGCTGTTTG TCCGCGGGAT CGGGTTCGGG GCCGCGAGCC TGCCTGCCAG CGCCGCCGTG 
TACCGGACGC TACGAACGGC TGACATTCCG GGCGCGACCA GCGCGAGCAA CGTCATCCAG 
CGCGTCGGCG CGGCGACCGG CACGGCCGTG ATGGCTCTCA TTCTCCAGGC GGACGGGTTC 
ACCCCTGCAC TCACCTGGAT GTTCGTCCTC ACCTCGGGCG CGCTCGCCGG GACCGTGTTT 
CTGCCAGGGC AGAAGCCGGC ACCGGCGCCG CGGGACACGG TGCCCACGAC GACGGCCACC 
GGCGCCCAGT AG

Protein sequence

MTRPEAHSGS ADGPNPSNDL EQAGPSLVPL ATTLIVGAFA ALLDTTVVAV AIDTLGRDLQ 
ADITVIQWVT TSYLLAMAAV IPVVGWLVDR FGARAIWSGA LGLFLAGSVL SGLAWSAGAL 
IAFRVLQGLG GGMILPLTQL VLARAAGPQH FGRVMGVVGL VGQLAPISGP VLGGLLIDTW 
GWRWIFFVNV PIVVVSLLMT TRWFPREDPR TERSLDVVGL VLLPTGIVAM IYALSNVESG 
STVVSAQVLV AALVGVALLA AFVLRPTTPG RPSLIDLRLF GDRSFRGGSV MLFVFGVTSW 
GPMFVLPLYY QQLRGLSALD AGFALAPQSV GLGLAYLATG RYADRLAPRP LVAGGLVVAS 
AGTLPFVFAT ADSNLTLLGI SLFVRGIGFG AASLPASAAV YRTLRTADIP GATSASNVIQ 
RVGAATGTAV MALILQADGF TPALTWMFVL TSGALAGTVF LPGQKPAPAP RDTVPTTTAT 
GAQ