Gene Dshi_1971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1971
Symbol
ID	5712965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	2084030
End bp	2085007
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	64%
IMG OID	641267894
Product	putative TRAP-transporter extracellular solute-binding protein
Protein accession	YP_001533311
Protein GI	159044517
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.418895
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.696077
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCTGA AGACCCCGAT TGCGTTCTCG ACGGCCCTGC CGGGGCTGGG CACGCCGATC 
CCGCGGGTGG CCGATGCGCT GGCGACCATG TCCGGCGGAA CGCTGAAGAT GAAGGTGTAC 
GAGCCCGGCA AGCTGGTCCC GGCCTTCGAG ATCCTGGATG CGGTGTCCTC GGGCAAGATC 
AACTCCGGCT ACACCACCGC CGGGTATTGG GCGGGCAAGA TCCCGGCGGC CCCCCTGTTC 
TCGGCTGTGC CCTTTGGCCC CGAGGCGGGC GAGTACATGG CATGGCTCTA TTACGGCAAC 
GGCATGGATC TCTATCAGGA GATGTATGAC CAGGCCGGCT ACAACGTGCA TGTGCTGCCC 
TGCGCGATCC TGGCGCCCGA AACCTCGGGC TGGTTCGCCA AGGAGATCAC GTCGGCCGAA 
GATCTGAACG GGCTGAAGAT GCGGTTCTTC GGGTTGGGCG GCAAGGTGAT GCAGAAGTTG 
GGCGTGGCCA CATCGCTGCT GCCCGGCGGC GAGATCTTCC CGGCGCTGGA GAAGGGCGCC 
ATCGACGCGA CCGAGTTCTC GATGCCCGCC ATCGATGCAC GGCTCGGTTT CCACAAGCTG 
GTGAAGTTCA ACTACTTCCC CGGCTGGCAC CAGCAGGCGA CCGTGTTCGA GTTGATGATC 
AACAAGGACG TCTGGAACGA CGCCAGCGAG CAGCACAAGG CGATCATCGA GAGCGCCTGC 
AAGGCGTCCA TGGCCGACAG CTTCGCCGAG GGTGAGGCGA TCCAGCACGC GGCGCTGATC 
GACAACGTGG AAAAGAACGG TGTCGAGATG AAGCAGTGGT CGCCGGAGAT GCTAGAGCTG 
TTCCGGGCGA CTTGGGACGA GGTGGCCGCA GAAGAAGCCG CGAACGATGA ATTCTTCGCC 
AAGGTACTGG CGGACATGAC CACGTTCCGC GACGGCTACG CTCTGTGGAA GCGCAACGCC 
TTCCTGCCGC GGGACTGA

Protein sequence

MLLKTPIAFS TALPGLGTPI PRVADALATM SGGTLKMKVY EPGKLVPAFE ILDAVSSGKI 
NSGYTTAGYW AGKIPAAPLF SAVPFGPEAG EYMAWLYYGN GMDLYQEMYD QAGYNVHVLP 
CAILAPETSG WFAKEITSAE DLNGLKMRFF GLGGKVMQKL GVATSLLPGG EIFPALEKGA 
IDATEFSMPA IDARLGFHKL VKFNYFPGWH QQATVFELMI NKDVWNDASE QHKAIIESAC 
KASMADSFAE GEAIQHAALI DNVEKNGVEM KQWSPEMLEL FRATWDEVAA EEAANDEFFA 
KVLADMTTFR DGYALWKRNA FLPRD