Gene Dshi_1810 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1810
Symbol
ID	5712798
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	1886324
End bp	1887496
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	73%
IMG OID	641267730
Product	putative major facilitator superfamily transport protein
Protein accession	YP_001533153
Protein GI	159044359
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.521814
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.460294
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCATG CCGTCCCCTC CGTGACCGAC TGGCCGCGCG TTCTCCTTCT GTGGGGCGCG 
GGGCTGGGGG CGGCGGCGCA ATACGGCAAG GTGTCGGTGA TCTTCGACCG CCTGCCCGCG 
CTGTACCCGG AGGCCGGGGC GCTTCTGGGT TGGGCGGTCT CGCTGGTCGG CGGGGTGGGG 
ATCGTGCTGG GCATCACCGC GGGGATCGTG GTCGCGCGCC TGACCCTGCG GCGCGCGCTG 
ATCTGGGCGC TGTGGCTCGG GGCGGCGATG TCGCTGCTGC AGGGGCTGGC GCCGCCGCTG 
TGGCTGTTTC TCGCCTCGCG CCTGGTGGAG GGGGCGTCGC ATCTTGCCAT CGTGGTCGCG 
GCCCCGACCC TGATCGCCAG CCTCAGCGCG GAGCGCGACC GGGGGCTGAC CCTGACCCTG 
TGGGGGACGT TTTTCGGGGT GGCCTTTGCC ATTCTCAGCT GGGCGGGCCT GCCACTGGTG 
GACCGGGCCG GGGCGCCCGC GCTGTTTCTG GCCCATGCGC TGTTCATGTC CGCTGCCGCG 
CTGGCGCTGT CGCGGTCCTT GCCGGAGGTG CCCACCGGGC CGGTGCCGCC CCTGCCGGGA 
CTGGGCGCGC TGGCGCGGCA GCATTTGGCG ATCTACCGCT CCCCGCGGCT GTCGGCCCCG 
GCGGCGGGGT GGCTGTTCTA TACCTTCTGT TTCGTGTCGC TGCTGACGCT GCTGCCGGCT 
TACCTGGACC CGGGCCAGCG CGCCTTCCTG ATCGGGGCGA TGCCGCTGCT GAGCATTGCC 
ACCTCGATGA CCCTGGGGGT GTGGATGCTG CGGCGGATGT CGTCCATCGC GGTGATCCAG 
ATCGGGTTCC TGGCCTCGGC AGCTTGCGCG CTGGCCCTGC TGGCCGTGCC CGGATCGCCC 
GCGATCTGCC TTGCGTTCGC GGCCGCGCTC GGGCTGGTGC AGGGGGCGAG TTTTGCCGCC 
GTGCCGGACC TGAACCCCGG GGCGCAGGAC CGCGCGCTGG CCAATGGGGC CATGGCCCAG 
ACCGGCAATA TCGGCAACAC GCTGGGCACG CCGGTCCTGT TCGCGCTGGC GAGCCTGGGC 
GGGCACGGGG TGATGATGGC GACGCTCTGC GCGCTGTTGC TGGCGGGGGC GGCGGCCCAT 
TGGGGGCTGC ACCTGGCGCG ACGCGCCGCC TGA

Protein sequence

MTHAVPSVTD WPRVLLLWGA GLGAAAQYGK VSVIFDRLPA LYPEAGALLG WAVSLVGGVG 
IVLGITAGIV VARLTLRRAL IWALWLGAAM SLLQGLAPPL WLFLASRLVE GASHLAIVVA 
APTLIASLSA ERDRGLTLTL WGTFFGVAFA ILSWAGLPLV DRAGAPALFL AHALFMSAAA 
LALSRSLPEV PTGPVPPLPG LGALARQHLA IYRSPRLSAP AAGWLFYTFC FVSLLTLLPA 
YLDPGQRAFL IGAMPLLSIA TSMTLGVWML RRMSSIAVIQ IGFLASAACA LALLAVPGSP 
AICLAFAAAL GLVQGASFAA VPDLNPGAQD RALANGAMAQ TGNIGNTLGT PVLFALASLG 
GHGVMMATLC ALLLAGAAAH WGLHLARRAA