Gene Franean1_3645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3645
Symbol
ID	5672012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4318859
End bp	4321204
Gene Length	2346 bp
Protein Length	781 aa
Translation table	11
GC content	67%
IMG OID	641242529
Product	MMPL domain-containing protein
Protein accession	YP_001507949
Protein GI	158315441
COG category	[R] General function prediction only
COG ID	[COG2409] Predicted drug exporters of the RND superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.197426
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACGGA TCGCTGAACT CGCTGTCCGT CGCCGATGGT TCGTCGTCGT CGGCTGGGTT 
GTCTTCATCG TCGCGGTGCA GGGGATCGCC GGGGCGATGG GCGGGGCTTC GTACAAGGAC 
ACGTTCAGCC TCCCGCACAC CGAGACCGCG TCCGTCGCGA AGCTCCTCGA GGATGCCGGC 
CTGAACAATC AGAACGGCGC CCCGGGCACG GTTGTGATCA AGAACGAGAG CGGAACGCTC 
ACCGAGCCGC CACCGAAGCT GAAACCGGCC CTGGCCGAGG TGTGCGCTTC GGGTAACCAT 
GTGGCACTGA TCGCGTCGCC CTGGGAGTCG ATCGACTGCT CGAAGAGCGA TGCCGAAGCG 
CCGGGAAACC CACAGCTGCT CAACAGTGCG CGCGGCTCCA CCACGGCCCT GGTCACCATC 
ACCTGGGAGA ACGACCACTA CGACGCCGAG CTGTTCAAGA ACGTCTACGA TCAGCTGAAG 
ACGCTGCGCA GCGATTCGCT GCAGGTCGAG TTCACCGGTA ACGCCTTCAC CGGCATCGGG 
CAGAGCGACG GCTCGGGCTC GTCGGTGTTC ATCGGATTCG CGGCTGCCCT CATCATCCTG 
GCGCTGGTGT TCCGTACCGT GGCCGCCACG GTGCTGCCGC TGGCCAGCGC GGTGGCCGCG 
CTCGTCAGCG GCCTCGGCGT GATCTACATC CTCAGCCACG CCATCAACGT CTCCAACATC 
ACCCCGTACC TGGCCGAGCT GATGGTGATC GGCGTCGGCG TCGACTACGC GCTGTTCATC 
CTCACGCGGC ATCGCCGCAA CCTGCGGCGC GGCATGCCCG TCGCGGATTC GATCGTGAAC 
GCGCTCAACA CCTCCGGCCG GGCGGTGCTG TTCGCCGGTA CGACCGTGTG CATCGCCATC 
CTCGGTCTGA TCGCACTCGG GGTGAGCTTC TTCAACGGCA TGGCGGTGGC GACCGCGCTC 
GCGGTCGGCT TCACCATGAT TGCCTCGCTG ACGCTGCTGC CCGCATTGCT GGCCATCTTC 
GGCCTGAAGG TGCTGCCCCG CCGGCAGCGG GCGGCGGTGC GGGCCGGTGA GTTCATCGAT 
GACCGTCCGG TGGGGGGCTG GGCCCGGTGG TCGCGGTTCG TCGCTGGGCG CCCCGTCGTC 
GTCGCGATCG TCTCGGGCGC GATCATGGTC GCGATCGCGC TGCCGTTCTT CTCGATGGAG 
CTGGGCGCCA GCGATCAGGG CAGCGACCCG AAGAGCTCCA CGACCCGCGA CGGTTACGAC 
CTGATCGCCT CCGATTTCGG CGTCGGCTAC AACTCCACTC TGGAAGCCGT TGTGAGCGGC 
CCGGGCGCCT CGGACCAGGC CTACCTGCAG CGCGTGACAA AGACGCTGTC CGCTGTCCCG 
GGCATCGACC CGGGCAGCCT GGGCACGGTT CCGCTCGCTG AGAACGTCGC CTTCGTGACG 
TTCAAGACGA CCACGTCACC GCAGTCGGAG AAGACCTACG AGCTGGTCCG GCACCTGCGC 
TCGACCACCC TGCCGCCGCT GTACGACGGC ACGGCCAACC ACATCTACAC CTACGGTGAC 
ACGGCGATCA ACGTCGACTT CGCCGCGGTG CTTGCCCGGA AGATGCCGCT GTTCATCGCG 
GTCGTGGTCG GCCTGTCGTT CGTCCTGCTG CTCGTCGCGT TCCGGAGCCT GGTCATCCCG 
CTGACCGCCG CGGTGATGAA CCTGCTGGCA GCGGGCGGTT CGTTCGGTCT GGTTGTGGCG 
ATCTTCCAGT ACGGCTGGCT CTCCGACAGC ATGGGCGCCG GACCAGGCGG ACCGATCGAC 
GCCTGGATCC CGGTCATGCT GTTCGCCATC CTGTTCGGCC TGTCGATGGA CTACCAGGTG 
TTCCTGGTCA GTCGCATGCA TGAGGAATGG GTACACACCC GCGACAACAA GCGATCGGTG 
ACCATCGGGC AGGGCGAGAC CGGCGGCATC ATCACCGCCG CCGCCATCAT CATGATTGCC 
GTCTTCCTCG GCTTCGTGGT CAGCCCGGGC CGGCCGATCA AGATCTTCGG TACCGGCCTC 
GCCGCCGCCG TGTTCATCGA CGCGTTCGTT CTCAGGACAA TGCTCGTACC GTCGCTGATG 
CACATTGTCG GCAAGGCGAA CTGGTACCTT CCGAAATGGC TGGACCGCAT CACTCCGCGA 
GTCTCGGTCG AACCAGCCGA CGAGGCCGTC CCCCACAGCG TGGGCACCGG CTCCTTCGAC 
ACCGACCGGC CTGAAGGCGA CGACGACCGG CCTGAAGGCG ACACCGACCG GCCCGAAGAC 
GAGGTCGACC GGCCCGAAGA CGACGACGAC CGGCCCGAAG ACGAGCGGGA GCTGGCCCGC 
TCCTGA

Protein sequence

MKRIAELAVR RRWFVVVGWV VFIVAVQGIA GAMGGASYKD TFSLPHTETA SVAKLLEDAG 
LNNQNGAPGT VVIKNESGTL TEPPPKLKPA LAEVCASGNH VALIASPWES IDCSKSDAEA 
PGNPQLLNSA RGSTTALVTI TWENDHYDAE LFKNVYDQLK TLRSDSLQVE FTGNAFTGIG 
QSDGSGSSVF IGFAAALIIL ALVFRTVAAT VLPLASAVAA LVSGLGVIYI LSHAINVSNI 
TPYLAELMVI GVGVDYALFI LTRHRRNLRR GMPVADSIVN ALNTSGRAVL FAGTTVCIAI 
LGLIALGVSF FNGMAVATAL AVGFTMIASL TLLPALLAIF GLKVLPRRQR AAVRAGEFID 
DRPVGGWARW SRFVAGRPVV VAIVSGAIMV AIALPFFSME LGASDQGSDP KSSTTRDGYD 
LIASDFGVGY NSTLEAVVSG PGASDQAYLQ RVTKTLSAVP GIDPGSLGTV PLAENVAFVT 
FKTTTSPQSE KTYELVRHLR STTLPPLYDG TANHIYTYGD TAINVDFAAV LARKMPLFIA 
VVVGLSFVLL LVAFRSLVIP LTAAVMNLLA AGGSFGLVVA IFQYGWLSDS MGAGPGGPID 
AWIPVMLFAI LFGLSMDYQV FLVSRMHEEW VHTRDNKRSV TIGQGETGGI ITAAAIIMIA 
VFLGFVVSPG RPIKIFGTGL AAAVFIDAFV LRTMLVPSLM HIVGKANWYL PKWLDRITPR 
VSVEPADEAV PHSVGTGSFD TDRPEGDDDR PEGDTDRPED EVDRPEDDDD RPEDERELAR 
S