Gene Dret_1647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1647
Symbol
ID	8419478
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1897174
End bp	1898148
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	58%
IMG OID	645038221
Product	putative sulfonate/nitrate transport system substrate-binding protein
Protein accession	YP_003198509
Protein GI	258405767
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGATCC GCCGAATTGT TCTGTTTGTT GTCCTGCTCT GTCTTTTCAG CGCCGGTGGC 
GCGATGGCTG AAATGACACC GGTCCGCCTG GCCCACGCCA CCTGGGTGGG GTATGGACCG 
TTGTATATCG CCCAGGAAAA CGGGTATTTC GAAGACGAAA ATATCGATAT GGACCTCTTT 
ATCATCGAGG ACGAGGCCCA GTACGCTGCC GCGTTGGCCT CGGGCAATAT CGACGGCCTG 
GGCAACGTCA TCGACCGTGA AGTCATCCAC TTCGCCAAAG GGACTTCGGA AGTGGTTGTC 
TTTGCCATGG ATGAATCCGC CGGCGGGGAC GGGATCATCG CCACTGAGGA GATCCAGAGT 
GTTGCGGATC TGGCCGGCAA GGACATCGGC CTCGACAAAT CCTCGACCTC CTATTTCTTT 
TTCTTGAGTA TCCTGGATAA ATACGGTGTC GACGAGCAGT CCATGACCTT CCACGAGATG 
GGCTCCTCCA ACGCTGGCGC GGCTTTTGTG GCCGGCAAGC TCGATGCCGC AGTGACCTGG 
GAGCCTTGGC TCTCCAAGAG CGATCAGCGC GAGGGCGGCC ACGTGCTCAT TTCCAGTGCG 
GAGATGCCCA AGACTATTGT CGATGTCGTG GTTCTCAACA GCGACTTCGT GGCCGAGCAC 
CCTCAGGTCC CCGCCGGTCT GACCCGGTCC TGGTTCCGGG CCATTGACTG GTATCGAGCC 
CATCCTGACA AGGGCAATGC CATTATGGCC GAGGCGATGG GGCTCAGTAC CGAAGAGATG 
GCCAGCATGG CCGAAGGGGT CCGCTTTATC GGCGAAAAGG GGAACAAAAC GTTTTTTGAC 
CCCTCGACCT CCGGCAATAT TTACGAGGTG GCAGACCGGG CCCTGGATTT CTGGCGCTCG 
AAGGGCATTA TCCAATCGCC GGTCAAGGCC GAGGAATTGG TGACCTCCGA ATACGTCAAC 
CAGGTTGCTG ACTAG

Protein sequence

MPIRRIVLFV VLLCLFSAGG AMAEMTPVRL AHATWVGYGP LYIAQENGYF EDENIDMDLF 
IIEDEAQYAA ALASGNIDGL GNVIDREVIH FAKGTSEVVV FAMDESAGGD GIIATEEIQS 
VADLAGKDIG LDKSSTSYFF FLSILDKYGV DEQSMTFHEM GSSNAGAAFV AGKLDAAVTW 
EPWLSKSDQR EGGHVLISSA EMPKTIVDVV VLNSDFVAEH PQVPAGLTRS WFRAIDWYRA 
HPDKGNAIMA EAMGLSTEEM ASMAEGVRFI GEKGNKTFFD PSTSGNIYEV ADRALDFWRS 
KGIIQSPVKA EELVTSEYVN QVAD