Gene Franean1_4479 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4479
Symbol
ID	5672829
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	5344346
End bp	5345605
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	72%
IMG OID	641243346
Product	major facilitator transporter
Protein accession	YP_001508762
Protein GI	158316254
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCGGC GAAAGCAGGT CAGGGTGAGA TCCGAAGGCT CCGCACCGAG GGGCAGATTC 
CTGGTGGTCG TGGGGGCGAG CGCGCTGGGC GTCGTCACGG TCGTGATGCC CTCGCTGCTG 
CTGGGTGCCC TGGCGCCGCA GATCAAGATG GATCTCGGCA TCGACGACGT GGCCATCGGG 
GTGGTGAGTA CCGTCTACGG GGGCGCGGGC GCCGCCGTAG CGCTGTTCGC TGGCGGGCTC 
GCGGATCGCA TCGGGTGGTC CCGGGCCATG ATGGCGGCGA ATTCCGCCGC CGCCGTCAGC 
TGCGTCGGGG TCGGGCTGCT GGCCGGGTCG TACGGAATTC TGCTCGGTTG CATGTTCCTC 
GCCGGCTGCG CGATGGGCCT GGGCATGCCC GCGTGCAGCC TTCTCCTGGC CAGCGAGGTC 
GGCGCGCATC AGCATGGGTT CGTCTTCGGC ATCAAGCAGG CGGCGACGCC CGCGGCGGCT 
CTGCTGGCTG GTCTCGCGGT GCCGCTCGTG GGCCTGACCC TCGGCTGGCG CTGGGCCTAC 
GGAGCCGTGA GCGTGCTGGC GGTCGCTGCG GCGGTGCTGA GCCGCCGCAT CCGGACGCTG 
CAGGCTCCCG GTCCGGCCGC GGGCGGCACA GCGGCGACGC ACCGGGCCGG CGGCGTCGCG 
ATGCCGAAGG GACGCCCCAG CGTCGCTGTG ATCCTCCCGC CGACGTCGGC TGCCGCTGGC 
GCGTCGATCG CGATGGGGGC GGTGCTGGCG TTCGTTGTGC TGTCCGCCGT CGAGGCCGGC 
CTCTCGCAGA GTAGTGCCGG GATTCTGCTG GCTGTCGGGA GCACCGCCGG TATCGCCGTC 
CGTATCGGTG GCGGGTGGTG TCTGGACCGT GGTGACGTGT CGGCGTTCCA GTTGTGCGGA 
TGGATGATTC TTGCTTGCGC GCTCGGTGCG GGAGCGATGG GGACCCGCGA CACCGTGCTG 
GTGGTCGCGG GTGCGATCGT GGCGCTGAGC GTGGGGTGTG GCTGGGCCGG CCTCTTTGAC 
GTCGGCCTTG TGCGGGGCAG TCCGCTCGCT CCCGCGCGGG CGTCAGGCCT GGGCCAGGTC 
GGCACGGCGG GCGGGGCGGC GGTGGGCCCG CTGCTGTTCG GACTCACGGT CGGTTGGTGG 
GGCTACCAGG TCGGCTGGTA CAGCATCGCG GTGCTGTCGA TGACCTCGGC CGGCGTGATG 
CTGTGGGCTG CCCGGCGCGC CCGGAGATCG GTACTGGCCA CAGTCACTGC TGCGCCGTGA

Protein sequence

MPRRKQVRVR SEGSAPRGRF LVVVGASALG VVTVVMPSLL LGALAPQIKM DLGIDDVAIG 
VVSTVYGGAG AAVALFAGGL ADRIGWSRAM MAANSAAAVS CVGVGLLAGS YGILLGCMFL 
AGCAMGLGMP ACSLLLASEV GAHQHGFVFG IKQAATPAAA LLAGLAVPLV GLTLGWRWAY 
GAVSVLAVAA AVLSRRIRTL QAPGPAAGGT AATHRAGGVA MPKGRPSVAV ILPPTSAAAG 
ASIAMGAVLA FVVLSAVEAG LSQSSAGILL AVGSTAGIAV RIGGGWCLDR GDVSAFQLCG 
WMILACALGA GAMGTRDTVL VVAGAIVALS VGCGWAGLFD VGLVRGSPLA PARASGLGQV 
GTAGGAAVGP LLFGLTVGWW GYQVGWYSIA VLSMTSAGVM LWAARRARRS VLATVTAAP