Gene Franean1_5283 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5283
Symbol
ID	5673617
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6355295
End bp	6356842
Gene Length	1548 bp
Protein Length	515 aa
Translation table	11
GC content	76%
IMG OID	641244140
Product	major facilitator transporter
Protein accession	YP_001509547
Protein GI	158317039
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.280334
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.245344
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGGTG GGCCACGAGG GCAGGGCGGG CCACGAGGGT CAGCAGGGAC ATCCGCGGGA 
ACCGGTCCGG GCGGGCCACA GACCGCCTCG CTGACCCACG GCGCCGTCGG ACGTCTGGTG 
GTCGCCCTCG GCACGGCCAC GCTGCTGCAG TGGCTCGGGG CGTTCGCGAT CGCGCCGATC 
CTCCCGCTCT ACCTGGAGGA ACGGGACGTC TCCGCCGGCG GGGTCGGCAT GGTCATGGCC 
GCGTTCTTCC TCGGCGCGCT GCTCTCCCAA TACCCCGCGG GCCTGGCCAC CACGACGCGG 
GGGCACCGCC CGGTGCTGGT CGCGGGGCTC GTCGCCTACG CCGTGGGGTG CGCCGGGCTG 
ATCGTCTCCC CGGGGATCAT GTGTGACACG GCGATGCGGG TGCTGCAGGG GGCCGGGGCC 
GGGGCGTTCG AGGTGGCCGT GCTCACCGCG ATCGCCGCGA CCGTGCCGCC GGACCTCACC 
GGCCGGGCCG TCAGCGCCGT CTACACCGGT CAGATCGCCG GCACCGCCAT CGGTCCGCTG 
CTCGGCGGGC TGGCAGGCGA GCAGCGGATG GACCTGCTCT TCCTAGGCGC AGGGGTGGCC 
GCGGCGGTCG CCTCCGTCCC GGTGCTCGTC CTGCTCCGAC CGGACGGCCC CGGTCACGCG 
CCGGCGCTGT CTGTGGCCTC TACCGGCTCC GACGCCTCCG CTGTCGGTCC CACCGCGGGT 
GGGGGTGCGG GCGTCCCCGG TGGGCGGGCG GGCGGCGCGG AGGCGGTCGC GGCCGTGGCG 
GCAGTCGCCG TGCACCGCGA CGGTTCCCCT GGTCATGCCG GCCGGCGGGC TCCCGCGTGG 
GCGTCCCGGC GGCGAACGTG GTCACCCCTC GCCGCGGTGG GGCCGGGGGT CGAGGGGCTG 
CTGCTGGTCG CCGCGGTGAA CGGCCTGGCC GTCGGGACCT ACGAGACCTG CTGGAGCCTC 
CTGCTGACCG ACCGGGGCAT CTCGACGGAG CTGGTCGGGC TCAGTTTCAC TCTGTTCTCG 
CTGCCCTACA TCGTCTGCGC CATGCCCGCG GGCTGGCTCG CCGACCACAA CGACCGCCGA 
TGGCTGGTGG TGGCGGCCAC GGCCACGACG GGTGTCACCG TCGCCACCTA CTCGTTCATC 
GGGTCGTTCT GGCTGATCGT CCTCGTGAGC TGTGCCGAGG CGATCGCGCT GGCCGTGAGC 
TTCCCATCCG CCCAGTCGCT GCTGGCGCAG GAGTCCGGGC CCGGTGGTGC CGGGCGGGCG 
CAGGGCCTGT TCACGACGAC CCAGACCGCC GCGACGGCCG GGGCGGCGCT GACGTCGGGC 
GCCCTGTACG CGGCGAACGC ACACCTCCCG TTCGTGCTGA CGGCCGTCGC GGCGCTCGCC 
GTCGCCGGTT CGCTGCCGCG GCTGTGGCGC AGGGTGCGGG GGACCGTGGT GCCCGCCGCC 
GTGCCGTCCG GGGCCGTGCC GTCCGGGGCC GTGCCGGCGG GGGCCGTGCC GGCGGCGAGC 
ACGGGACCCG CCGGCGGGGC GTTCGCCAGC CACCTGATCA CCCGGTAA

Protein sequence

MPGGPRGQGG PRGSAGTSAG TGPGGPQTAS LTHGAVGRLV VALGTATLLQ WLGAFAIAPI 
LPLYLEERDV SAGGVGMVMA AFFLGALLSQ YPAGLATTTR GHRPVLVAGL VAYAVGCAGL 
IVSPGIMCDT AMRVLQGAGA GAFEVAVLTA IAATVPPDLT GRAVSAVYTG QIAGTAIGPL 
LGGLAGEQRM DLLFLGAGVA AAVASVPVLV LLRPDGPGHA PALSVASTGS DASAVGPTAG 
GGAGVPGGRA GGAEAVAAVA AVAVHRDGSP GHAGRRAPAW ASRRRTWSPL AAVGPGVEGL 
LLVAAVNGLA VGTYETCWSL LLTDRGISTE LVGLSFTLFS LPYIVCAMPA GWLADHNDRR 
WLVVAATATT GVTVATYSFI GSFWLIVLVS CAEAIALAVS FPSAQSLLAQ ESGPGGAGRA 
QGLFTTTQTA ATAGAALTSG ALYAANAHLP FVLTAVAALA VAGSLPRLWR RVRGTVVPAA 
VPSGAVPSGA VPAGAVPAAS TGPAGGAFAS HLITR