Gene Dshi_2067 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_2067
Symbol
ID	5713062
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	2187413
End bp	2189017
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	65%
IMG OID	641267989
Product	sulfate transporter
Protein accession	YP_001533405
Protein GI	159044611
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.701494
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCCCGAG CTCTGCTGGC ATCCTTTGCC AATCGTATCG CCTTTTCCGC CCCGACCGCC 
GATGAAACCC TCAGCATCTC GCGCATTCGG ATCGAGTTGT TGTCCGGCCT GACCGTGGCG 
CTGGCCCTCG TGCCCGAGGC CGTGGCGTTT GCCTTCGTGG CGGGGGTGCA TCCGCTGGTG 
GGACTTTACG CGGCCTTCAT CGTGGGTCTG ATCACGGCGC TGATCGGGGG GCGGCCGGGC 
ATGATCTCGG GCGCGACGGG CGCGCTGGCC GTGGTCATGG TGGCGCTGGT GGCCGAGCAC 
GGGGTCGAGT ACCTGTTCGC CACGGTGGTG TTGATGGGGA TCCTCCAGAT CCTCTTCGGC 
ATCTTCAAGC TGGGCAAGTT CATCCGGCTG GTGCCGCATC CGGTCATGCT GGGCTTCGTC 
AACGGGCTGG CCATCGTGAT CTTCCTGGCG CAGCTGACCC AGTTCAAGGT GCCCAACGAC 
GCTGGAGAGA TGGTCTGGAT GACCGGCTGG CCGCTGGTGA TAATGCTGGG TCTGGTGGCG 
CTGACCATGG CGATCATCTG GGGCATGCCC AAGATCACAC GCGTTATTCC CGCGCCGCTG 
GCGGGGATCG GGATCGTGGC GGTTCTGGTC ATCGCCTTCG GGATCGACGT GCCGCGGGTG 
GGGGATCTCG CCTCCATCGC GGGGGGCTTG CCGAGCCTGC ATATCCCCAT GGTGCCGCTG 
AACATGGAGA CGCTTCAGAT CATCGCGCCC TATGCCTTCA TACTCGCGGC CATCGGCCTG 
ATCGAGAGCC TGCTGACCCT GAACCTGGTG GGGGAGATCA CCGGCAAGCG GGGCGGCGCG 
AGCCAGGAGT GCATCGCCCA AGGCGTCGCC AATACCGTGA CCGGGTTTTT CGGCGGCATG 
GGCGGCTGCG CGATGATCGG CCAGTCGATG ATCAACGTGA AATCCGGTGG GCGGACGCGG 
ATCGCCGGGG TGGCGGCGGC GCTCTTTCTG TTGCTGTTCA TCGTGGCGGC CTCGCCGCTG 
ATCGAGCAGA TCCCGCTCGC GGCCCTCGTG GGCGTAATGT TCATGGTGGT GATCGGCACC 
TTCGCCTGGC AATCCCTGAC GATCCTGCGC CGGGTGCCGT TGACGGATGC GCTGGTTATC 
GTGCTGGTGA CGGTGGTCAC GGTGCTGACA GACCTTGCCA TCGCGGTGGT GGTGGGGGTG 
ATCGTCTCGG CGCTGGCCTA TGCCTGGAAT AACGCCTCGC GCATTCACGC CAAGACCTAC 
ACCACCCCCG AGGGGGCGAA GGTGTACCAG GTGCAGGGGC CGCTCTTTTT CGGCTCGTCG 
GCCGGGTTCG TCGAGCTGTT CGATGTGACC CATGATCCGG GTCAGGTCAT CGTGGACTTC 
GCCGACAGCC GGGTGGTCGA CCAATCCGCG CTGACCGCCA TCGAAGCCAT GGCCGCAAAA 
TACGCCGATG CGGGCAAGAA CCTGCAACTG CGCCACCTGA GCCGGGACTG TCACCAGTTG 
CTGACCAAGG CGGGTCAGTT GATGATCGAC AGCGACGATG ACCCCGACTA CGCCATCGCC 
GCCGACTACC AGGTCAAGAC CGGTATCCTT GGCGGGGGAC ACTGA

Protein sequence

MPRALLASFA NRIAFSAPTA DETLSISRIR IELLSGLTVA LALVPEAVAF AFVAGVHPLV 
GLYAAFIVGL ITALIGGRPG MISGATGALA VVMVALVAEH GVEYLFATVV LMGILQILFG 
IFKLGKFIRL VPHPVMLGFV NGLAIVIFLA QLTQFKVPND AGEMVWMTGW PLVIMLGLVA 
LTMAIIWGMP KITRVIPAPL AGIGIVAVLV IAFGIDVPRV GDLASIAGGL PSLHIPMVPL 
NMETLQIIAP YAFILAAIGL IESLLTLNLV GEITGKRGGA SQECIAQGVA NTVTGFFGGM 
GGCAMIGQSM INVKSGGRTR IAGVAAALFL LLFIVAASPL IEQIPLAALV GVMFMVVIGT 
FAWQSLTILR RVPLTDALVI VLVTVVTVLT DLAIAVVVGV IVSALAYAWN NASRIHAKTY 
TTPEGAKVYQ VQGPLFFGSS AGFVELFDVT HDPGQVIVDF ADSRVVDQSA LTAIEAMAAK 
YADAGKNLQL RHLSRDCHQL LTKAGQLMID SDDDPDYAIA ADYQVKTGIL GGGH