Gene Daro_2134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2134
Symbol
ID	3567550
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	2303454
End bp	2304449
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	61%
IMG OID	637680605
Product	thiosulphate-binding protein
Protein accession	YP_285345
Protein GI	71907758
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	3.73195e-21
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000103932
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGCGCAAGA TTGGCCTTTT CGCTGCACTG ACTCTCGCTT TCGGCCTCGG TAGCGCCGCT 
GCCCAGACCA CGCTGCTCAA TGTCTCCTAC GACCCGACGC GTGAGTTGTA CAAGGACTTC 
AACGCTGCCT TTGCCAAGCA ATGGCAGGCC AAGACCGGCC AGATCGTTAA CGTCCGCCAG 
TCACACGGCG GTTCCGGCAA GCAGGCCCGT TCGGTGGCCG ACGGTCTGGA AGCCGATGTG 
GTCACCCTGG CCCTTGGCTA CGACATCGAT GCCCTGGCCG AGCGGAAGCT GATCCCCGCC 
GATTGGCAGA AGCGCTTCCC GAACAACTCC TCGCCCTATA CCTCGACCAT TGTCTTCCTG 
GTCCGCAAGG GCAACCCGAA AGCGATCAAG GACTGGGGTG ATCTGGCCAA GCCAGGCGTC 
GCGGTCATCA CACCGAACCC GAAGACTTCG GGCGGTGCCC GCTGGAACTA TCTGGCGGCC 
TGGGCCTGGG CGTTGAAACA ACCCGGTGGC AATGAGCAAA AGGCCAAGGA TCTGGTCAGC 
GCAATATTCA AGAACGTGCC GGTCCTCGAT TCCGGCGCCC GTGGTTCGAC CACCACCTTC 
GTCGAGCGAG GCCTGGGTGA TGTGCTGATC GCCTGGGAGA ACGAAGCCAT TCTGGCGGTG 
ACGGAACTGG GCAAGGACAA GTTCGAGATC GTCGCGCCGA GCCTGTCCAT CCTGGCCGAA 
CCACCGGTCG CGGTCGTCGA CAAGGTCGTC GAGAAGCGCG GCACGCGGCT GACAGCGCAG 
GCCTATCTCG ATTACCTGTA TTCCGAAGAA GGCCAGCAGA TCGCTGCCAA GCACTACTAC 
CGGCCGAGCA ACGCCAAGGT GGCGGCCAAG TACGCGGCCA TTTTCCCGAA ACTGAAACTG 
GTCACCATCA ACGACAGCTT CGGCGGTTGG CAGAAAGCGC AGAAAACGCA CTTCGCCGAT 
GGTGGCACCT TCGACCAGAT CTATCTGAAG AAATAA

Protein sequence

MRKIGLFAAL TLAFGLGSAA AQTTLLNVSY DPTRELYKDF NAAFAKQWQA KTGQIVNVRQ 
SHGGSGKQAR SVADGLEADV VTLALGYDID ALAERKLIPA DWQKRFPNNS SPYTSTIVFL 
VRKGNPKAIK DWGDLAKPGV AVITPNPKTS GGARWNYLAA WAWALKQPGG NEQKAKDLVS 
AIFKNVPVLD SGARGSTTTF VERGLGDVLI AWENEAILAV TELGKDKFEI VAPSLSILAE 
PPVAVVDKVV EKRGTRLTAQ AYLDYLYSEE GQQIAAKHYY RPSNAKVAAK YAAIFPKLKL 
VTINDSFGGW QKAQKTHFAD GGTFDQIYLK K