Gene Phep_3453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_3453
Symbol
ID	8254573
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	-
Start bp	4105895
End bp	4107157
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	41%
IMG OID	644937105
Product	major facilitator superfamily MFS_1
Protein accession	YP_003093708
Protein GI	255533336
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.403237
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.0945543
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACAAC CTCAAAAAAA TATAGCCGAG CCTTTTAGTT CTTACCAACT GCTGGTTATT 
GCCTTGCTGG CTTTACTGCA GTTTACAATT GTACTGGACT TTATGGTACT TGCGCCACTT 
GGCGACTTTT TAATGAAATC GTTATCCATA AGCCCTAAAG GTTTTGGATT GGTCGTCTCT 
TCCTATGCTT TTAGTGCAGG TGCTTCAGGA ATTATGGCTG CCGGTTTTGC CGATAAATTT 
GACCGTAAAA AGTTGCTGCT GTTTTTTTAC AGCGGTTTTA TTATAGGAAC CTTGTGTTGT 
GCACTTGCCA CCAATTACGA GATGCTACTT GGTGCAAGGA TTGTAACCGG TTTATTTGGT 
GGTGTAATCG GCGCCATCTC TATGACAATC ATTACAGATA TTTTTGCCGT TCACCAACGT 
GGCAGAGTGA TGGGGGTTGT GCAGATGGGT TTCGCTGCAA GCCAGGTACT GGGTATACCC 
ATTGGTTTGT ATTTTGCCAA TATATGGGGC TGGCATTCTT CATTTCTGAT GATTGTGATA 
TTGGCAATAA TGATCGCAAT TGCAATTCTG ATCAAGATAA AACCAATTGA CAAGCATCTG 
GCCATACAAT CAGACAAAAG CGCCTTCCTG CATTTGTGGC ATGCGGTTTC TAACCGTTCC 
TATCAGACAG GATTTATTGC AACTGCATTT ATGGGTGTTG GTGGTTTTAT GTTAATGCCA 
TTTGGAAGTG CTTATCTGAT CAATAACATC AACATTACTG AAGCGCAACT GCCATTGGTA 
TTTATGTTTA CCGGCCTGGC TGCTGTTGTT GTAATGCCAT TAATTGGAAA ATTAAGTGAT 
AAAGTAGACA AGTTTATGGT GTTTACTGGT GGGTCATTGC TTGCAGTGGT AATGATTCTG 
GTATACACTA ACCTTAGTCC GGTTCCATTA TGGCAGGTTA TCGTGATCAA TATGGTCTTA 
TTTATGGGGG TGATGAGCAG GATGATTCCT GCAACTACAC TTACGATGAG CATCCCTGAC 
CTAAATGACA GGGGGGCTTT TATGAGTGTC AATGCTTCTA TACAACAAAT GGCCGGTGGT 
ATTGCTGCGT TATGTGCTGG TTTGATCGTT ACACAGAGAA CAAAGAGTAG TCCACTGGAG 
CATTATGATA CTTTAGGTAT AGTGGTATCG GCACTTATAC TTTTATGCAT ATTTTTGGTT 
TACCGTGTAA GTGTAATGGT GAAAAAGAAA GACGCTGTAT TGAAAATCCC AGCTAAGCAC 
TGA

Protein sequence

MQQPQKNIAE PFSSYQLLVI ALLALLQFTI VLDFMVLAPL GDFLMKSLSI SPKGFGLVVS 
SYAFSAGASG IMAAGFADKF DRKKLLLFFY SGFIIGTLCC ALATNYEMLL GARIVTGLFG 
GVIGAISMTI ITDIFAVHQR GRVMGVVQMG FAASQVLGIP IGLYFANIWG WHSSFLMIVI 
LAIMIAIAIL IKIKPIDKHL AIQSDKSAFL HLWHAVSNRS YQTGFIATAF MGVGGFMLMP 
FGSAYLINNI NITEAQLPLV FMFTGLAAVV VMPLIGKLSD KVDKFMVFTG GSLLAVVMIL 
VYTNLSPVPL WQVIVINMVL FMGVMSRMIP ATTLTMSIPD LNDRGAFMSV NASIQQMAGG 
IAALCAGLIV TQRTKSSPLE HYDTLGIVVS ALILLCIFLV YRVSVMVKKK DAVLKIPAKH