Gene Phep_3480 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3480
Symbol
ID	8254600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	4142180
End bp	4143385
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	41%
IMG OID	644937131
Product	major facilitator superfamily MFS_1
Protein accession	YP_003093734
Protein GI	255533362
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTGC CCAAACAAAT TGCTGGCCAT TATAAAGAAT CATTTTCAGG TTTAAGCAGG 
GAAACCTGGA TCCTAAGCAT AGTGATGCTT ATTAACCGTA GCGGTTATAT GGCCGTTCCA 
TTTATGGGTC TGTATGTGAC GCAGTCGCTG CACCGCCTGC CTTCAGATGC AGGATTGATC 
ATTACGCTTT TTGGTATTGG CTCTATATTG GGCTCGGCCG TTGGCGGCAA GCTTACAGAC 
GTCATTGGGT TCAGACCTGT ACAAATTATT GCGGCCATAG TAAGTGGTAT TTTCTTTTTA 
TTTTTTGCCA GTGTTACCCA TTTTCAAACA CTATGTGTAC TGGCTTTGGT CATCAGCTTT 
TTTTCAGAGG CCTTTCGGCC TGCTAATTTT GCTGCTATCG CAGCTTATGC AAAAAAAGGG 
CTCGAAACTC GTTCCTATTC CTTAAACCGT CTGGCAACCA ATATAGGCTG GGCTTTTGGG 
GTTAGTATGG GTGGTATGAT TGCTTCTTAT AACTACAGAC TCCTATTTTA TATAGATGGG 
GCAGTTAGTA TTTTTGCCGG CCTGTGTATC CTCTTTTTCT TGCCCAGAAT CCGAAACTAC 
AGCAAAACCA TAAAAGAAAA AGTAAAAGGT GTTGTGGTCA GAAAACCATG GCAGGATACT 
GTTTTCGTTA AATTCATTCT TCTTACCACC GTTTTTATTT TAGGTTTCTT CCTGGTTTTC 
CGTGTTGTTC CTGTATTTTT TAAAGAAATC TGGAAAATCG ATGAATTTAT GATCGGATTA 
ATCCTTGGTC TTAATGGTGT AATCATTGCG CTATTTGAAA TGGTAATGAT CCATAAAATT 
GAGCATAAAA AATCGCCCAT GTTCTTTATC GTTATTGGTG TTTTACTTAT CGCTGCTTCG 
TTCCTGCTGC TGATGCTGCC TTTTGGCAAT CCGGTATTTC TGGGTGCATT ATGCCTTATT 
TTATTTACAC TGGGCGAAAT GTTTACACTC CCATTTGTAA ATACATTTGT AATGAGCAGA 
GCAAATGAGT TTAACAGGGG GTTATATGCT GCAGGCTACA TGTTAAGCTG GTCTGTAGCC 
CAGGTAGTTG GTCCTACCGC AGGTTTTTAC ATTGCAGAGC AGTATGGTTA CAACACTTTG 
TGGATTGGAT TGTCTACCTT GATGTTGCTG ACTGCTTATT TTTATAAACG CCTTAAAACA 
GTCTAA

Protein sequence

MSLPKQIAGH YKESFSGLSR ETWILSIVML INRSGYMAVP FMGLYVTQSL HRLPSDAGLI 
ITLFGIGSIL GSAVGGKLTD VIGFRPVQII AAIVSGIFFL FFASVTHFQT LCVLALVISF 
FSEAFRPANF AAIAAYAKKG LETRSYSLNR LATNIGWAFG VSMGGMIASY NYRLLFYIDG 
AVSIFAGLCI LFFLPRIRNY SKTIKEKVKG VVVRKPWQDT VFVKFILLTT VFILGFFLVF 
RVVPVFFKEI WKIDEFMIGL ILGLNGVIIA LFEMVMIHKI EHKKSPMFFI VIGVLLIAAS 
FLLLMLPFGN PVFLGALCLI LFTLGEMFTL PFVNTFVMSR ANEFNRGLYA AGYMLSWSVA 
QVVGPTAGFY IAEQYGYNTL WIGLSTLMLL TAYFYKRLKT V