Gene TM1040_3332 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3332
Symbol
ID	4075231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	341777
End bp	342667
Gene Length	891 bp
Protein Length	296 aa
Translation table	11
GC content	60%
IMG OID	638004840
Product	Sulfate ABC transporter, permease protein CysT
Protein accession	YP_611566
Protein GI	99078308
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0555] ABC-type sulfate transport system, permease component
TIGRFAM ID	[TIGR00969] sulfate ABC transporter, permease protein [TIGR02139] sulfate ABC transporter, permease protein CysT

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.845298
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.297479
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGGCC CCGAGGGGGC CGGACGAAAC CCATACCGGA GTATCACCGT GGTGTCCCTG 
ACCCGAACCG CCCCGCGCGT GCTGCCGGGG TTTTCCCTTT CTCTTGGCGT GACACTATTG 
TTCGTGACGC TGATCATCCT ATTGCCCCTA AGCGGGTTGA TGTGGCAACT CGCTCAACTG 
AGCCCGGCTG ACTATATCAA GGTGATGACA TCTCGCCGCG TGCTTGTTGC GCTCAAGGTG 
ACACTGTCTG CGGCGGCTCT TGCAACGCTG ATCAATGCCG TCTTTGGTCT GCTTCTGGCT 
TGGGTCCTGG TGCGCTATCG CTTTTGGGGG CGCGGAGTCC TGGACGCGCT TGTCGACATT 
CCCTTCGCGC TGCCGACTGC TGTGGCGGGG ATCGCATTGG TGGCGCTCTA CGACAAATCC 
GGCTGGATCG GCGGGATGCT CGCGGAGTTT GACATCAAGA TCGCCTATAC TTGGTGGGGC 
ATTGTAATCG CGATGGTGTT CACCTCGGTG CCCTTTGCGG TGCGCGCGAT ACAGCCCGCG 
ATCGAGGAAC TGGACCCCGA TGAGGAAGCC GCGGCGCTCA CGCTTGGGGC CAGTGGTCTA 
CAAAGGTTTG TGCGGGTGAT CCTGCGTCCA TTGCTGCCTG CGATCCTGAC CGGAGTTGCG 
CTCTCATTTG TGCGCTCGCT CGGAGAGTTC GGCGCGGTCA TCTTCATCGC CGGGAACCTC 
CCCTTCAAGA CCGAGATCGC CTCGCTTCTG ATCCTGATCC GACTTGATGA GTTCGACTAT 
CCGGCGGCGG CGGCGATTGC CGGTAGCCTT CTGGGGCTAT CGCTTTTGTT GTTGATCGTG 
GTCAACCTGG TGCAAACCCG GCTCTATCGC TACCTGCGGA CGGAAGGGTA G

Protein sequence

MFGPEGAGRN PYRSITVVSL TRTAPRVLPG FSLSLGVTLL FVTLIILLPL SGLMWQLAQL 
SPADYIKVMT SRRVLVALKV TLSAAALATL INAVFGLLLA WVLVRYRFWG RGVLDALVDI 
PFALPTAVAG IALVALYDKS GWIGGMLAEF DIKIAYTWWG IVIAMVFTSV PFAVRAIQPA 
IEELDPDEEA AALTLGASGL QRFVRVILRP LLPAILTGVA LSFVRSLGEF GAVIFIAGNL 
PFKTEIASLL ILIRLDEFDY PAAAAIAGSL LGLSLLLLIV VNLVQTRLYR YLRTEG