Gene Phep_3851 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3851
Symbol
ID	8254985
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	4620453
End bp	4621970
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	47%
IMG OID	644937515
Product	major facilitator superfamily MFS_1
Protein accession	YP_003094104
Protein GI	255533732
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00711] drug resistance transporter, EmrB/QacA subfamily

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAAAG ACAAAAAGAA TACACTTACC CTGGCCGCCG TTTGCCTTTC CTCATTAATG 
TTTGGATTGG AAATATCTAG TGTGCCGGTA TTACTGCCCA CACTCGAAAA ATTATTAAAA 
GGCAATTTCA GTGATGTACA ATGGATCATG AATGCCTATA CCATTGCTTG CACTACAGTA 
TTGATGGCTT CCGGTACGCT TGCAGACCGC TATGGCCGCA AACTTGTTTT TACAGCCGGG 
CTTTTGCTTT TTGGTATAAC CTCTCTGCTT TGTGGGCTGG CCACGGCGAT GCCATTACTC 
ATCGCAGGAC GTTTTTTACA AGGACTTGGC GGAGGCATTA TGCTGATCTG CCAGGTTGCG 
ATTCTTTCTC ACCAGTTCCA GGACGGACGC GAACGCAGCC TGGCCTTTGC CGCCTGGGGG 
ATTGTTTTCG GAGTAGGCTT GGGGTTCGGG CCTCTAATTG GCGGTATGAT CCTCACATTT 
TTAAGCTGGA AATGGGTGTT TCTGGTACAT GTGCCACTCA GCTTGCTTAC ACTGGGACTT 
GCATGGGCCG GGGTGCGGGA ATCGCGGTCG GCTCAAATAC AGCGATTGGA TACCTTAGGG 
ATGGTCACTC TTTCCTTAGC TGTTTTTGGA CTGATTTATT ACATTACCCA GGGACCCGCA 
ATGGGATTTT CAAGCCTTTA CGCGCTATTG ATTCTGGGGG CATCTGCAGC TTGTTTTCTG 
CTCTTTTTAT ATGCAGAAAA GACAAGCACC CAGCCTATGT TTGATTTTAC CGTATTCAGG 
ATACGGGACT TTTCCGGGGC CATCATCGGC TCTATTGGCA TGAACTTTTG CTTTTGGCCC 
TTTATAATCT ACCTTCCTAT CTATTTTCAG GGTGTGTTGG GGTACAGTAG CCTTATGGCC 
GGTACGATGC TGCTGGCCTA TACTTTGCCT ACATTGGTAG TTCCACCACT GGCCGAGCGG 
CTTTTGATGA AATACCGGCC CGGTATCGTT ATCCCATTCG GGCTTTTTAT CATCGGACTG 
GGATTTATAT TGATGTGGTT TGGCATCCAT GTTGCACACA TGGGGTCGTG GACCATGATA 
CCAGGTATGT TGTTGTCCGG CATCGGACTA GGGTTCTCTA ATACTACGGT TACCAACACT 
ACCACAGGTG CTGTGAGTTC AGACCGTGCA GGTATGGCTT CAGGGATAGA CATGAGTGCA 
AGACTGATCA CCCTGGCAAT CAATATTGCT TTAATGGGAT TCTTGTTAAG TAAAGGTGTG 
CTCATTCATT TAAAGATTGC ATTCGCAGGA GTTTTTGATA GTCCTCAGCT CCATTCGGTG 
GCTGAAAAGA TCGCAGCAGG AAATTTTGCT GGCCTTCTGG AAAAATATCC CAGGATTGCT 
ACTTTAGACC CGGCTGGCGA TATTACACAT CAGGCATTAG CTGGCGGTTT TCAACTGCTG 
ACTTTGTTCG GCGGAATTGG GGTAGTTTTC CTTGCATTGG TCAGTTTCTT TATATTTAAG 
CCACGATCAA TTCGATAA

Protein sequence

MFKDKKNTLT LAAVCLSSLM FGLEISSVPV LLPTLEKLLK GNFSDVQWIM NAYTIACTTV 
LMASGTLADR YGRKLVFTAG LLLFGITSLL CGLATAMPLL IAGRFLQGLG GGIMLICQVA 
ILSHQFQDGR ERSLAFAAWG IVFGVGLGFG PLIGGMILTF LSWKWVFLVH VPLSLLTLGL 
AWAGVRESRS AQIQRLDTLG MVTLSLAVFG LIYYITQGPA MGFSSLYALL ILGASAACFL 
LFLYAEKTST QPMFDFTVFR IRDFSGAIIG SIGMNFCFWP FIIYLPIYFQ GVLGYSSLMA 
GTMLLAYTLP TLVVPPLAER LLMKYRPGIV IPFGLFIIGL GFILMWFGIH VAHMGSWTMI 
PGMLLSGIGL GFSNTTVTNT TTGAVSSDRA GMASGIDMSA RLITLAINIA LMGFLLSKGV 
LIHLKIAFAG VFDSPQLHSV AEKIAAGNFA GLLEKYPRIA TLDPAGDITH QALAGGFQLL 
TLFGGIGVVF LALVSFFIFK PRSIR