Gene Dtpsy_1923 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtpsy_1923
Symbol
ID	7385080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidovorax ebreus TPSY
Kingdom	Bacteria
Replicon accession	NC_011992
Strand	-
Start bp	2057834
End bp	2058853
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	62%
IMG OID	643655240
Product	sulfate ABC transporter, periplasmic sulfate-binding protein
Protein accession	YP_002553379
Protein GI	222111115
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.436654
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAATC GCCGCGACTT TATCAAGTTT CCCCTGGCCA CCGCCCTGAC GGCGGTCATG 
TCCCTGACGT CTTTGCCGTC GTTCGCGCAG CCCGCGCAGT TCCTCAACGT GTCCTACGAC 
CCCACGCGTG AACTCTATGT GGCCTACAAC CAGGCCTTCG CACGCCACTG GAAGGCCAAG 
ACGGGGCAGG AAGTGCAGTT CAAACAGTCG CACGGCGGCT CGGGCAAGCA GGCGCGTTCG 
ATCATCGATG GCATCGACGC CGACGTGGCT ACGCTGGCCC TGGGCGGAGA CGTGGATGCG 
CTGGCACAGC ACGGCCTGCT GGCGCCCGCT TGGCAAAAGC GCCTCCCGCA CAACTCGGCG 
CCCTATACCT CCACCATCGT GTTCTTGGTG AAGAAGGGCA ACCCCAAGGG CGTGAAGGAT 
TGGGATGACT TGGTCAAGCC CGGCGTGCAA GTCATTACCC CCAACCCCAA GACCAGCGGC 
GGGGCGCGCT GGAACTATCT TGCTGCCTGG GAATTCGCCA AGCGCAAGTA CGGCAGCGAC 
ACTCAAGCCA AGGATTTCGT GTCCAAGCTC TACAAGAACG TGCCGGTGCT CGACACGGGT 
GCGCGCGGCT CGACCATCAC CTTCGTGCAG CGCGGTGTGG GCGACGTGCT GCTGGCCTGG 
GAGAACGAGG CGTTTCTTGC GCTCAAGGAG TTCGGCAAGG ACAAGTTCGA GATCGTCGTG 
CCATCGCTGT CCATCCTGGC CGAACCCACA GTGGCGGTGG TGGACAAGGT GGTGGACAAG 
AAGGGCACGC GCGCGCTGGC GGAGGAGTAC CTTGCCTACC TCTATTCCGA CGAGGGGCAG 
GACATTGCTG GAAAGAACTT CTACCGTCCA ACCAGCGAGA AGGCCAAGGC CCAGTACGAC 
AAGCAATTCC CCAAGCTCAC ACTGGCCACC ATCGACCAGG CTTTCGGTGG CTGGGCCAAG 
GCCAATCGGG AGCATTTTGC GGACGGCGCA CTGTTTGACC AGATCTACAG CCGGCGTTGA

Protein sequence

MNNRRDFIKF PLATALTAVM SLTSLPSFAQ PAQFLNVSYD PTRELYVAYN QAFARHWKAK 
TGQEVQFKQS HGGSGKQARS IIDGIDADVA TLALGGDVDA LAQHGLLAPA WQKRLPHNSA 
PYTSTIVFLV KKGNPKGVKD WDDLVKPGVQ VITPNPKTSG GARWNYLAAW EFAKRKYGSD 
TQAKDFVSKL YKNVPVLDTG ARGSTITFVQ RGVGDVLLAW ENEAFLALKE FGKDKFEIVV 
PSLSILAEPT VAVVDKVVDK KGTRALAEEY LAYLYSDEGQ DIAGKNFYRP TSEKAKAQYD 
KQFPKLTLAT IDQAFGGWAK ANREHFADGA LFDQIYSRR