Gene Francci3_2045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2045
Symbol
ID	3904618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2405925
End bp	2407445
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	69%
IMG OID	637879382
Product	major facilitator transporter
Protein accession	YP_481148
Protein GI	86740748
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.706094
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCTACG AAAGTTCGAG AACGGTGTCC GCTGACGTGG CGCGCACTCG CCCGGCCATG 
TCTGGCGCCG GGTCGGGAGC GGTCGCCGCG CCTGGCCAAA CCGCCGCGGG CCCCGCGGCT 
GAGCCGGCCT ACCCGCGAAT CCTCCTAGCC GCGGGCATGG TCCTCGCGGA CACGTCGATC 
CTGAATGTCG TCTCCCCCGT CATGCGGGAT CAGTTCAACG CGAGCATCGG GAGCCTGCAG 
CTCGCCATCG CCGGTTATCA GATCGGCTAC GCGTCGGTCC TCGTAGCCGC CGGCGCCGTC 
GGCGACCGGC GAGGCCGCCC GGAGACCTTT CGGATCGGAC TGGCGGCCTT CGCGCTGACC 
TCGATCGCCT GCGCCGCGGC ACCAAACATC GGCTGCCTCA TCGCCTTCCG GGTAGTCCAG 
GGCCTAGCCG CGGGTGTCCT TTTCCCACAG ATTCTGGGAA TCATCCGCGG CGCGGTGGCG 
GATCGACAGG TCGGTCTGGT CGCGGCGATG AGCATGATTA TGAGTCTGGC CACCGTCGTC 
GGGCCGATTG TGGCCGGAGT GATCGTCTAC AGCGCTCCGA GCTCGTTCAG TTGGCGGCTG 
GTCTTCCTGA TCAACGTGCC GTTCTGCCTG TGGGCGTGGA GCGGCACCCC ACGAGTGGCC 
AGCGGGGGCC GGTCCTCGCT CAACGGGCAG CTGGACGTCG TCGGCGCGCT CGGAATCGCC 
GCACTGGTGA CCGCGATAGC GCTCCCGCTG ACCCTGGGAC GCTCGCTCGG GTGGCCGCTG 
TGGGCGCTGC TGCTGCTGGT ATGTGCCGCA CCGGCCGCGG TGTTGTATGC CTGGCACCAG 
CGTCTTCGCC ACGATCGGCA GCTGCCCTGC ACCTTCCCGG TCAGCGCGTT CAGGGAAAGG 
CAGCTCCTCC AGGCCGCGAT CGCATATTTT CTGTTCTTCG CGGCCAGCAC CTGTTTCTTC 
CTGTACTTCT CGATCTTCCT CGAGGAAGGC GCCGGTGCGA GCCCGCTCGC GGCTGGTCTG 
AGCCTTGCCC CCTACGGGAT CGGTGCCGCG ATCACAGCCA AGGCGTCGAG CCGGCTCGTG 
GCGCGCACCA GCATCCGCAC CGTCGTCGTC AGCGGCGCTC TGCTATGCGC GTTGGGCTCG 
CTGGGCACCT GCCTGCTGGT GGCGCACCTC AGCCGCGGCT GGCTGGTGGC CGGGGCCGCC 
CCCGCGCTGA TCGTCACCGG AGCGGGCCTG GGGCTCGTGG TCTCCACCGT GCTTCGGCTG 
GTATTGGCGC TTGCACCTCC CCAGGAAGCG GGCTCCGTCG GCGGCGCGCT CTCCACTGGC 
CAGCAGATCG GCGGTGCGAT CGGCATTCTG CTGTTCGGGC TCTTCTTCCC CATCCACCTG 
AGCCCCTCGG TCGATCTGGG GTCGCTCAGA GTCGGCATCG AACATGGCCT GATCTACGAG 
GCATCGGCTT TCGCCCTCGT CGCGGCCCTG TTCACCCTCA CCAGCCAGCG CCGTGGCGCC 
GGCCCGCGGC AGGCGCGGTG A

Protein sequence

MRYESSRTVS ADVARTRPAM SGAGSGAVAA PGQTAAGPAA EPAYPRILLA AGMVLADTSI 
LNVVSPVMRD QFNASIGSLQ LAIAGYQIGY ASVLVAAGAV GDRRGRPETF RIGLAAFALT 
SIACAAAPNI GCLIAFRVVQ GLAAGVLFPQ ILGIIRGAVA DRQVGLVAAM SMIMSLATVV 
GPIVAGVIVY SAPSSFSWRL VFLINVPFCL WAWSGTPRVA SGGRSSLNGQ LDVVGALGIA 
ALVTAIALPL TLGRSLGWPL WALLLLVCAA PAAVLYAWHQ RLRHDRQLPC TFPVSAFRER 
QLLQAAIAYF LFFAASTCFF LYFSIFLEEG AGASPLAAGL SLAPYGIGAA ITAKASSRLV 
ARTSIRTVVV SGALLCALGS LGTCLLVAHL SRGWLVAGAA PALIVTGAGL GLVVSTVLRL 
VLALAPPQEA GSVGGALSTG QQIGGAIGIL LFGLFFPIHL SPSVDLGSLR VGIEHGLIYE 
ASAFALVAAL FTLTSQRRGA GPRQAR