Gene Dshi_1559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1559
Symbol
ID	5712703
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	1620493
End bp	1621701
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	68%
IMG OID	641267474
Product	major facilitator superfamily transporter
Protein accession	YP_001532902
Protein GI	159044108
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00710] drug resistance transporter, Bcr/CflA subfamily

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.418069
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.23279
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCCCG CCCGCCTGTC CCAAGCCGAG TTCATTGCCC TGATGGCGAT GCTGTTCGCG 
ACGATTGCGT TTTCCATCGA CGCGATGCTT CCCGCCCTGC CCGAGATCGC CGCCGAACTG 
ACGCCCGGTG ACGTGAACCG GGCGCAGTTG ATCGTGACCT CGTTCGTATT CGGGATGGGT 
TTGGGCACCC TGGTGGCCGG GCCCTTGTCG GATGCCTTCG GGCGCAAGCC GGTGATCGTG 
GCGGGCGCGG TGCTCTATTG CGCGGCGGCG GGGCTGGCTT GGGCGGCGCA ATCGCTGGAA 
CTGGCATTGG CGGCACGGGT GCTGCAGGGG TTCGGCGCGG CCGCCCCGCG GGTGGTGGCG 
ATCGCCATGG TGCGCGACCT CTATGTCGGG CGGCACATGG CGCGGATCAT GTCGCTTGTC 
TTCCTGATCT TCGCGCTGAT CCCGGCCATC GCGCCGAGCC TTGGCGCGGT CATCATCCAT 
TTCGCCGGGT GGCGGGCGAT TTTCGCCTCC TTCATCCTGT TTGCCATGCT GTCGGTGGGC 
TGGATGATGC TGCGCCAGGC CGAAACCCTG GCGCCCGAGG CGCGCAGGCC GCTCTCGGTG 
CGGGGTGTGG CGGACAATGT GGTCGAAGTG CTGCGCGACC GGGTGGTGCG CCTGTCGATC 
CTGGCGCAAA CCATGGCCTA TGCCACGTTA TTTGCGACGC TGTCCTCGAC CCAGCCGGTG 
TTCGATGTGA CCTTCGGCAA GGCGGAGACC TTCCATCTGT GGTTCGCGGT GATCGCCCTT 
CTGGCGTCGA GCGCCAGCTA CATCAATTCG CGGCTGGTGG TGCGGCTGGG CATGCGGCGC 
ATGGTGCGCG GGGTGCTGAC CGGGCAGATC GCGGTCTCGG GCGTGTTCCT GTCCGTGAGT 
GTCGTGGGCT GGCCCGAGGC ACTGCATTTC TGGGCCTATT TCGTCTGGGT GACGGGGGTG 
TTCTTCATGG CGGGCATGAC CCTGGGCAAC CTCAATGCCA TCGCGATGGA GCCGATGGGG 
CATATCGCGG GCACGGCGGC CTCGGTGGTG GGGGCGCTGT CGACCATGGG GTCGGTGTTA 
CTGGCCATTC CCATCGGGCT GCTGTTCGAC GGCACGCCGG TGCCGGGCGT TGCGGGGGTT 
CTGGTGCTGT GCCTCGGGGC GCTGGCCGTG ATGAAGGTGC TGGGCGCGCG GGGTGAGGCG 
CCGGCCTGA

Protein sequence

MPPARLSQAE FIALMAMLFA TIAFSIDAML PALPEIAAEL TPGDVNRAQL IVTSFVFGMG 
LGTLVAGPLS DAFGRKPVIV AGAVLYCAAA GLAWAAQSLE LALAARVLQG FGAAAPRVVA 
IAMVRDLYVG RHMARIMSLV FLIFALIPAI APSLGAVIIH FAGWRAIFAS FILFAMLSVG 
WMMLRQAETL APEARRPLSV RGVADNVVEV LRDRVVRLSI LAQTMAYATL FATLSSTQPV 
FDVTFGKAET FHLWFAVIAL LASSASYINS RLVVRLGMRR MVRGVLTGQI AVSGVFLSVS 
VVGWPEALHF WAYFVWVTGV FFMAGMTLGN LNAIAMEPMG HIAGTAASVV GALSTMGSVL 
LAIPIGLLFD GTPVPGVAGV LVLCLGALAV MKVLGARGEA PA