Gene Francci3_1772 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1772
Symbol
ID	3904002
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2107934
End bp	2109397
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	66%
IMG OID	637879110
Product	major facilitator transporter
Protein accession	YP_480877
Protein GI	86740477
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.819492
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.422548
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTAATA AGAGGGGGAG TCGGGCGATT CGCGGCGGGC GCGACCTTGA CGCTGATAAA 
TCCAGCCCGA CTGGTGCGCT CCTTCTGCTG AACATCCAAC ACCTGCTGAT CGCGATGGAC 
TTCACCGTCG TCTTCGTGGC GCTGCCAACA ATGGGGGACG ACCTCGGTCT CACTGATCGT 
GGGCTGACCT ACGTCACCGC GACTTACGGG CTGGCCTTCG CTGCGTTCCT GCTGTTGGGT 
GGCCGAGCCG CGGACGTGTT CGGGCGGCGC CGGGTGCTCT TGGTGGGACT CGCGCTATTC 
GTCGTCGCCT CGGTAGTCGC GGTGTCAGGC TCGGCCGCCG CGTTGCTGGT TGGCCGCAGC 
ATGCAGGGTG CCGCCGCGGG CCTCATCACC CCGGCCGCCC AAGCCTTGGT CGTCACGCGA 
TACCCCGAGG GGAAACAGCG TACGAGGGCG CTGAGTTGGT GGGGTGTCAC CGGTGCGGGC 
GGCCTGGCCC TGGGGGGACC GGCCGCAGGG GTACTGACCT GGGCACTGGA CTGGCGGGCT 
GTCCTGCTGG TCAATGTCCC GATTGGGTTG CTGTGCTTGG TCTTGGCGCC ACGGCTGATC 
GCCGTCGACG CGACCAGGGA GACCGAGGCT GGGCCCCGGT TCCGTCTTCC CGCGGTCCTA 
ACGGCAGGCG CGGCGATGGG TCTTCTGGTA TGGACGGTCG CCGAGGGTCC GGTCTCTGCC 
GCTGCGGATA CCCTGGTCCG GGCAACGGCC GTAGTGGTGC TACTGGGAGC ATTCGTGCTT 
ATGGAGCGGC GGAGCACAGA TCGGCTGATG CACCGCGATA TCTTGCGCGT CCGTCCGGTG 
GCTGTCGCCG ACCTGATGTC GGTGTTTTTC GGTGCCGCCC TCGGAGGGCA GTTCTTCGCT 
ATCACCCTGT ATCTGCAGGC AGTGAGCGGA ATGTCCGCGC TCGTCGCCGG ACTGATGTTT 
ATTCCGGTTA CGCTTTTCAT GGTCGTAGGC AACAAGGTCG GAGTCCTGCT GATCGCTAGA 
ATCGGCCCCA TCCGCAGCCT GCCTGTCGGG CTGGCAATTG CTGCGGTGGC CGAGGTGGCG 
ATGGCGTTCT TGCCCACCGG TGGTGGCGTG CCGTTGCTGG TTCCCGCGAT GATCCTGCTC 
GGTCTGGGCC AGGGCATCGC GTTCGTCGCG ATCACCGTTG CTGCCACGGC CACCGTCGCA 
GCTGAGCGGC AGGGTGTTGC GTCCGGACTA CTCAACGTTG GCATGAACAT TGGGCAGTCG 
ATCGGTCCCG CCGTGCTCGC CGCGATTGTC ACCTGGCGGT CCACTGCCGC CCTCGACGGC 
GGGGCGGGCC AGGCCGAGGC GAACAACCAG GGTTTGCACG GCGCTTTTCT GGCCATCGCC 
GCGATCGTGG TCGTGGGACT GCTGGTGTGC GGGGTGCTGC TGCGGTCGGG ACCGGGCCGA 
GTCGAATCGG TCCACGCAGG CTGA

Protein sequence

MVNKRGSRAI RGGRDLDADK SSPTGALLLL NIQHLLIAMD FTVVFVALPT MGDDLGLTDR 
GLTYVTATYG LAFAAFLLLG GRAADVFGRR RVLLVGLALF VVASVVAVSG SAAALLVGRS 
MQGAAAGLIT PAAQALVVTR YPEGKQRTRA LSWWGVTGAG GLALGGPAAG VLTWALDWRA 
VLLVNVPIGL LCLVLAPRLI AVDATRETEA GPRFRLPAVL TAGAAMGLLV WTVAEGPVSA 
AADTLVRATA VVVLLGAFVL MERRSTDRLM HRDILRVRPV AVADLMSVFF GAALGGQFFA 
ITLYLQAVSG MSALVAGLMF IPVTLFMVVG NKVGVLLIAR IGPIRSLPVG LAIAAVAEVA 
MAFLPTGGGV PLLVPAMILL GLGQGIAFVA ITVAATATVA AERQGVASGL LNVGMNIGQS 
IGPAVLAAIV TWRSTAALDG GAGQAEANNQ GLHGAFLAIA AIVVVGLLVC GVLLRSGPGR 
VESVHAG