Gene Franean1_3988 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3988
Symbol
ID	5672348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4772891
End bp	4774339
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	68%
IMG OID	641242866
Product	major facilitator transporter
Protein accession	YP_001508283
Protein GI	158315775
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2271] Sugar phosphate permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.958906
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGATAG CCGCGCACCC TTCGGCCGAG CCGGCCCCGA CCACAGCTGA CCCGCTGCGT 
TGGCGGGCAC TGGCCGCGAT AGCCGCCGGC CAGCTCATGA TTGCGGCAGA CGTCACGATC 
ATGAATATCG CACTGCCGTC CGCCCAGCAC TCCTTGCACC TGTCAACGGC GCAACGACAG 
TGGGTGATCA CCCTCTTCGC TCTCGCCTAC GGCGGGTTCC TCCTGCTCGG GGGCAGACTG 
TCCGATCTGA TCGGTCGCAA GCGCTGCCTG CTGATCGGAC TGGCGGGTTT CGCCGCAGCC 
TCGGCGCTGG GTGGGGCAGC CGTGAACCCA ACCATGCTCC TGGTTGCTAG AGCGCTCCAG 
GGCATATTCG GGGCGCTGTT CACACCCTCC GCCCTCGCGC TGCTCGGTAC GACATTCACC 
GAACCCTCCG AACGCGGCAA AGCCTTCGGG ATCTACGGCA CCGTGATGGC GGGCAGTTCC 
GGCATCGGAC TGATCCTCGG CGGCGTCCTC ACCAACTACC TCGACTGGCG CTGGTGCATG 
CTCGTGAGCC TGCCCATCGC GGTCGGCGCT GCCGCCGGAG TCAGCGCGAC GGTTCGCGCG 
ACCCCCCGCC GGCTCGGCAC CGAGGTAGAC ATCGTCGGCG CGGTGCTCGC CACAACCGGG 
CTCATGGCAC TGGTCCTTGG ATTCACCCGC GCGGAGTCAC AAGGCTGGGC CACCCGGATC 
ACGCTGGGCG TTCTTGCCGC CGGAGTCATC CTTCTCGCGC TGTTCGTCCT AGTGGAAAGC 
CGCACCGGAG CGGCCCTCCT GCCGCTGCGG GTCGTCCGTG AGCGTCGACG AGCCGGTGCG 
TACCTGGCCG TCCTGTGCAT GGCGATCGGC ATGTTCGCCG GATTCTTCTT CCTCACCTTC 
TACCTGCAGG ACATCCTCGG ATACTCACCG ATCAAGGCAG GACTCGCGTT CCTCCCGTTC 
ACTGCGGCGA TCATGCTAGG AGTACGCGTC ATCCGCGGGT TCCTGATGCG CGCACCCCTG 
CGGCTGCTGC TGTGCCCGGG TCTCCTGGCA TGCGCGGCCG GACTCGCACT GCTCGGCCTA 
CTACGCGCCG ACGGCGGCTA CGTCACCGGG GCGCTTCCCG TCGTCGTGCT GCTCGGACTC 
GGTGTCGGCT GTGTGCTGCT GCCTGCCAAC AACATCGCGA CTCTCGGCGC GGGCCCGGAC 
ACCGGCGTCG CCGGCGCCAT CGTGATGACC TCCCAACAGA TCGGCGCCTC GCTCGGCACC 
GCCCTGCTCG GCAGCATCGC CGCTACCGCC ACCACCGCCT ACGTCCACTC GCACGCCGCC 
GCGGCCGACC TCCCCGCACG GGCCGCGGTG CACGGCTACA ACGTAGCCGG CCTCTCCGGC 
GCCGCCTTCC TGTGCCTCGC AACGACCCTG GTGTTCCTCC TTACCGGTCC GAGGAACCCC 
AACCAATAA

Protein sequence

MRIAAHPSAE PAPTTADPLR WRALAAIAAG QLMIAADVTI MNIALPSAQH SLHLSTAQRQ 
WVITLFALAY GGFLLLGGRL SDLIGRKRCL LIGLAGFAAA SALGGAAVNP TMLLVARALQ 
GIFGALFTPS ALALLGTTFT EPSERGKAFG IYGTVMAGSS GIGLILGGVL TNYLDWRWCM 
LVSLPIAVGA AAGVSATVRA TPRRLGTEVD IVGAVLATTG LMALVLGFTR AESQGWATRI 
TLGVLAAGVI LLALFVLVES RTGAALLPLR VVRERRRAGA YLAVLCMAIG MFAGFFFLTF 
YLQDILGYSP IKAGLAFLPF TAAIMLGVRV IRGFLMRAPL RLLLCPGLLA CAAGLALLGL 
LRADGGYVTG ALPVVVLLGL GVGCVLLPAN NIATLGAGPD TGVAGAIVMT SQQIGASLGT 
ALLGSIAATA TTAYVHSHAA AADLPARAAV HGYNVAGLSG AAFLCLATTL VFLLTGPRNP 
NQ