Gene Phep_2211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_2211
Symbol
ID	8253317
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	2547977
End bp	2549218
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	47%
IMG OID	644935860
Product	major facilitator superfamily MFS_1
Protein accession	YP_003092477
Protein GI	255532105
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.895405
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGAATT CCGGACAAAC CGTTTCCTTT TACGCATGGC TCATTGTCGC CCTGCTATGG 
ATAGTGGCCT TTTTAAATTA CCTCGACCGC ATCCTGATCA CTTCTATGCG CGATCCGATT 
GTTGCCGATT TCAATTTATC TGATGCGCAA TTTGGCTTAC TTACATCGGT ATTCCTCTGG 
TCTTACGGTA TACTGAGCCC TTTTGGGGGT TTTTTCGCCG ACAGGTACAG CAGAAAAAAA 
GTTATCGTGT TCAGTGTAAT GGTCTGGTCG GCCGTAACCA TCTGGACAGG CTATGCCACT 
TCATTTCATG AAATGCTGGC AGCCCGTTTC TTAATGGGGG TAAGTGAAGC CTGTTATATA 
CCGGCAGCCC TTGCCCTGAT CACTGATTAC CATAAAGGTC GCACACGTTC ACTGGCAACC 
GGATTACACA TGAGCGGCTT ATATGCAGGC CTTGCCCTGG GCGGTCTTGG CGGTTACATC 
GCAGAACTAT GGGGCTGGCG TTCTGGCTTC CATATTTTTG GAGCAGTAGG GATTGTGTAT 
TCTTTGATAC TTTTATACAT TTTAAAAGAC CAGAAAGCTT CCGCAGAAAC AGCAGAAACA 
GCAGAAACAA GTACCCAAAC CACTGGCATT AGTCTTACCG GTGCCTTGAA AGTCTTGTTC 
AGCGAAGCCT CTTTCCTCAT CCTCCTCATC TATTTTGCCG TTCTTGGTAT CGTAAACTGG 
CTGGTTTACG GCTGGCTGCC AACCTTTCTC AAAGATCATT TCAACCTTAA CCTCGGCGAA 
GCCGGCATTT CTGCAACGGG TTATATCCAG ATCGGTTCTT TTATAGGTGT AATTGTGGGG 
GGCATACTGG CCGACAGGTG GACAAGGAAA AACAACCGCG GCCGACTCTA CATCCTCATT 
ATTGGGTTTA CCTTGGGTGC ACCATTCTTA TTTCTAATGG CCTCAACCAG CATTTTTAGC 
ATCGCAATCC TGGCCATGCT CATCTTCGGC CTGGCCAGGG GATTTAATGA TGCCAATATG 
ATGCCCATAT TACGGCAGAT AGCCGATGGA CGGTATATTG CAACGGGCTA TGGCTTTCTT 
AACTTTTTAA GCACAATTGT AGGCGGACTG ATGGTTTACG CTGGCGGCGC ATTAAAAGAT 
GCCCAGGTAG ACCTTTCCAT TGTTTACCAG ATCTCAGCTG TCGTTATGCT ATTAGCCACT 
TGGCTATTAT TTGCAATAAA GCTCAAAAAC AGCAATTCCT GA

Protein sequence

MKNSGQTVSF YAWLIVALLW IVAFLNYLDR ILITSMRDPI VADFNLSDAQ FGLLTSVFLW 
SYGILSPFGG FFADRYSRKK VIVFSVMVWS AVTIWTGYAT SFHEMLAARF LMGVSEACYI 
PAALALITDY HKGRTRSLAT GLHMSGLYAG LALGGLGGYI AELWGWRSGF HIFGAVGIVY 
SLILLYILKD QKASAETAET AETSTQTTGI SLTGALKVLF SEASFLILLI YFAVLGIVNW 
LVYGWLPTFL KDHFNLNLGE AGISATGYIQ IGSFIGVIVG GILADRWTRK NNRGRLYILI 
IGFTLGAPFL FLMASTSIFS IAILAMLIFG LARGFNDANM MPILRQIADG RYIATGYGFL 
NFLSTIVGGL MVYAGGALKD AQVDLSIVYQ ISAVVMLLAT WLLFAIKLKN SNS