Gene Dshi_1421 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1421
Symbol
ID	5712598
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	+
Start bp	1473533
End bp	1474705
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	63%
IMG OID	641267334
Product	ribose ABC transporter
Protein accession	YP_001532764
Protein GI	159043970
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.194337
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAATGC GAATTTTGGC ATCTTTGGGG TTGGTGTCGA CCTTGATGAT AAACACTGCC 
GCGATGGCAG AGGGCCTCGA AGAGTTGCCG CCGAAGCTTC AGGCCGCCTA TCAGGGGGTC 
GACGAGGGCC AGCCGATCGG GACGTCGGCC TATCGCGACT GGACGCCTCG GTCCGGTCCG 
CCCTGGACCA TCGGCTATGC AAGCTCCTAT GCCGGCAACA CGTGGCGCGC AGAGGGCTTG 
AGCCGTCTGA CCGAGGATTT GCTGCCGGTT TACAGGCAGG CGGGGCTGGT TGACGAGATC 
ATCGTCACGC AATCGGATCT CAACGACGCG CGCCAGATCC AGCAGATCCG ACAGCTTGTG 
GACCAGGGCG TGGATGCGAT CATCGTGTGC TGCTCGAACC CGGTCGCCCT GAACAAGGCC 
GTCGAATATG CCTACTCCAA GGGTGTCGTG GTGTTTTCCT ATTCGGGCTA TCTGACGTCG 
GACAAGGCGC TGAACGCCTC GTCGAACTAT ACGCTGGGCG GCTATGAAAT CGCCAAGGCG 
ATGATCGAGG AAGTGGGCGG CGAGGGGAAC TTCCTGCTGG TGTCGGGGAT CGCGGGCGCG 
GCCTCTTCGG AGAGCTTCGA CACCGGCGCC ATGCGCGCCT TGGAGGAGTT TCCGAACGCC 
AAGCTGGTTG GCCAGGTCTG GGGCAACTGG ACCGACCAAG TCGCCCAGAC CGAGGTTCAG 
AAGTTCCTCG CAACCAACCC CGCGCGGATT GACGGGATCA TCGCGCAGGG CTCCCAGGAA 
ACCGGTGTGC TGAAGGCGGT GTTGCAGTCG GGCCGCGAGG TGATGCCGAT CTCGCTGGCA 
GGCTCGGCCG GAGCGGCTTG CTATCTAAAG CAGAACCCCG ATTGGATCAG CCATGCGTTC 
CAGATCTGGC CCCCGGGCGA CGAGATGGAA CTGGGCTTCA ACTCGGTGAT CCGCACGCTG 
CAGAACCAGG GTCCCAAACT GCAATCGATC CTGCGCGGGG TCTACCGGCT GCCCGCGGCG 
GAATACGTGG CGAGCCTGGG CGATGACTGC TCGGTCGACT CGACCGCGTA CATCCAGCCG 
GGCATCGACG TCTGGTTCCC CGACGACAAG GCCGCCGGCT ACTTCCTGCG GCCGGAAAAC 
CCGCTCGATT GGGCCGCCAA GAACGTCAAC TGA

Protein sequence

MRMRILASLG LVSTLMINTA AMAEGLEELP PKLQAAYQGV DEGQPIGTSA YRDWTPRSGP 
PWTIGYASSY AGNTWRAEGL SRLTEDLLPV YRQAGLVDEI IVTQSDLNDA RQIQQIRQLV 
DQGVDAIIVC CSNPVALNKA VEYAYSKGVV VFSYSGYLTS DKALNASSNY TLGGYEIAKA 
MIEEVGGEGN FLLVSGIAGA ASSESFDTGA MRALEEFPNA KLVGQVWGNW TDQVAQTEVQ 
KFLATNPARI DGIIAQGSQE TGVLKAVLQS GREVMPISLA GSAGAACYLK QNPDWISHAF 
QIWPPGDEME LGFNSVIRTL QNQGPKLQSI LRGVYRLPAA EYVASLGDDC SVDSTAYIQP 
GIDVWFPDDK AAGYFLRPEN PLDWAAKNVN