Gene Dshi_1453 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dshi_1453
Symbol	ssuA2
ID	5712630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dinoroseobacter shibae DFL 12
Kingdom	Bacteria
Replicon accession	NC_009952
Strand	-
Start bp	1511962
End bp	1512945
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	72%
IMG OID	641267366
Product	putative sulfonate/nitrate transport system substrate-binding protein
Protein accession	YP_001532796
Protein GI	159044002
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.892723
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0689078
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCCC TTACCCGCCG ATCCACCCTC GCCCTTCTCG GCGCCGCCAC TGGCGCCCTT 
GCCCTGCCCC GCCGCACGGT CGCCGCCCCG ATCCCGCGTC TAGCGCTCTA CGGGCCGCCC 
GCCGGTCCGT CGATCACGCT CGCCCATGCG GTCACCGCCG GACTGCTGAC CGACATCGCG 
GACGAGACGC GCTTTACCGC CTGGCGCAGC CCCGACGAGT TGCGCGCCGG GCTGACCTCG 
GGCGAGATCC TCGCCTCGGT GGTGCCGATC CAGGCGGCGG CGAACCTCTA CAACCGCGGC 
TTCCCGATCC GGCTGGCCAA TGCCATGACC AACGGCCTGC TCTATGTCCT CGCCGAAGAT 
CCCGGGATCG CGGCGATCCC CGATCTTGCG GGCCGTCACA TCGCCGTGCC CTTCCGCGGC 
GACACGCCCG AGATCATTTT CGGCCAGCTT CTCGCCCATT ACGGTCTGGG CCCGGACGAT 
CTGCAGATCA CCTATGCCGG TACCCCGACC GAGGCGATGC AGCTGATGCT GGCCGGGCGC 
GTCGACGCCG CCCTGACCGC CGAGCCCTCG ACCACGGCGG CGGTGCTGCG GGGGCGCGAG 
GCGGGCAAGC AGATCCGGCG CGCGATCAAC CTGCAAAACG CTTGGGGCGA GATGACCGGG 
GCCGCCCCCG TCCTGCCGCA GGCGGGACTG GCTCTGACCG GAACCTTCCT CGCGGAGCAT 
GGCGAGACGG TGCCTGCGCT TCTGACCGCG CTGGAGCAGG CGACCGCCGA TGTCCTGGCC 
AAGCCGCAGG CGGCCGCGGC CCATGCAACG AAGGCCCTCG GCCTGCCAGC GCCGCTTCTG 
GCGGCCTCGA TCCCCCATGC GAACCTCGTC GCCCGTCCCG CCACCGAGGC GCGGGCGGAT 
ATCGAACGGA TGCTGACGGC CATGGGCGGG ACGGACCTCG CCCGGATCGG CGGCGCCCTG 
CCCGACGACG CCTTCTACCT CTGA

Protein sequence

MTSLTRRSTL ALLGAATGAL ALPRRTVAAP IPRLALYGPP AGPSITLAHA VTAGLLTDIA 
DETRFTAWRS PDELRAGLTS GEILASVVPI QAAANLYNRG FPIRLANAMT NGLLYVLAED 
PGIAAIPDLA GRHIAVPFRG DTPEIIFGQL LAHYGLGPDD LQITYAGTPT EAMQLMLAGR 
VDAALTAEPS TTAAVLRGRE AGKQIRRAIN LQNAWGEMTG AAPVLPQAGL ALTGTFLAEH 
GETVPALLTA LEQATADVLA KPQAAAAHAT KALGLPAPLL AASIPHANLV ARPATEARAD 
IERMLTAMGG TDLARIGGAL PDDAFYL