Gene Phep_1458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_1458
Symbol
ID	8252559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	1732490
End bp	1733707
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	44%
IMG OID	644935112
Product	major facilitator superfamily MFS_1
Protein accession	YP_003091734
Protein GI	255531362
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.288009
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.592381
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGAGT TTTTTAGATT GTACTTAGAG GCCTACAGAG GGCTCTCTAC CCCGGCATGG 
ATGCTGGCAT TGGTGATGCT GATCAACAGG AGCGGAGCGA TGGTCATTCC CTTCTTAGGG 
GTTTATATGG TCAACCACTT AAATTTTAGT ATAGAAGATA CGGGCACTGT ACTAAGCTGT 
TTTGGTATTG GCGCTGTATC AGGCTCTTTT TTAGGTGGCT GGTTAACAGA TAAAGTGGGT 
CATTTTAAAG TCCAGCTGTT TAGCCTGATC CTGACTGTGC CCATGTTTTT TCTGCTGCCG 
GAACTGAATA CTGTTTTAAA GCTGGCCATT GGTGTGTTTA TACTCAGCAT TATTTCAGAG 
ACCTTCAGGC CTGCAAACTC GGTTTCTATT GCTTATTATT CGAGGCCGGA TAACATTATC 
CGTTCTTTTT CTTTAAACCG GATGGCGGTA AACCTTGGTT TTTCTATAGG TCCCGCCCTT 
GGGGGCTTTC TGGCTGCAGT ATCGTATACC TTTTTATTTT ACGGAAATGC TGTTGCGGCG 
TTTTTATCGG CTTTATTGTT CTTTATTTAC TTCCGCAACC GTAAGGGAAA TGAAAAGAAA 
GCGGTTGTCC AGGAGAGTTT TACTGTTGAT CCTGGCACAA GCCGTTCTCC GTATAACGAC 
GGGCTTTTTA TCGCTTTCAG TATGCTGAGC TGTATATATG CAATTTGTTT CTTTCAGCTG 
CTGAGCACCC TGCCTTTGTA TTACCGCACA ATTTATAAAC TTACTGAAGC CGACATTGGG 
ATTATTCTGG CTTTTAGTGG CATGGTGGTG TTTTTGTTTG AAATGCTCCT GGTACACATT 
GCCGAGAAAA GAATGACCGC CAGGGCAGTT ATTGTATCGG GTGTATTGCT TTGCAGCCTG 
TCGTTTTTTA TCCTCAATTT AACAAATGGC ATCTGGGTAC TGTACTTAGC TATGTTTGTG 
CTTTGTATTT CCGAAATTCT GGCCATGCCC TTTATGTCTA CCATAACCCT GCAGCGTTCC 
TCGTTAAAAA CCAGGGGCGC CTATATGGGC ATTAATGCTT TGTCTTTTTC TGCTGCACAT 
GTGTTCTCGC CATTTGTGGG CACCAGGATA GCTGCTGCTT ATGGATTTGA AACCCTGTGG 
TACGGTACTA CGTTGGTACT GTTGCTTACA GCTGCAGGGT TTTTGCTGGT CATGAAAAAA 
ATGAAGTTAT CGGCATAA

Protein sequence

MKEFFRLYLE AYRGLSTPAW MLALVMLINR SGAMVIPFLG VYMVNHLNFS IEDTGTVLSC 
FGIGAVSGSF LGGWLTDKVG HFKVQLFSLI LTVPMFFLLP ELNTVLKLAI GVFILSIISE 
TFRPANSVSI AYYSRPDNII RSFSLNRMAV NLGFSIGPAL GGFLAAVSYT FLFYGNAVAA 
FLSALLFFIY FRNRKGNEKK AVVQESFTVD PGTSRSPYND GLFIAFSMLS CIYAICFFQL 
LSTLPLYYRT IYKLTEADIG IILAFSGMVV FLFEMLLVHI AEKRMTARAV IVSGVLLCSL 
SFFILNLTNG IWVLYLAMFV LCISEILAMP FMSTITLQRS SLKTRGAYMG INALSFSAAH 
VFSPFVGTRI AAAYGFETLW YGTTLVLLLT AAGFLLVMKK MKLSA