Gene Tcr_0033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tcr_0033
Symbol
ID	3760359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Thiomicrospira crunogena XCL-2
Kingdom	Bacteria
Replicon accession	NC_007520
Strand	+
Start bp	40487
End bp	41740
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	45%
IMG OID	637784739
Product	sulfonate ABC transporter, periplasmic sulfonate-binding protein, putative
Protein accession	YP_390304
Protein GI	78484379
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGTCAAT ATTGCAACTG TGATCAAGAA TCATCAGAAC TAGACTATCA ATTTAACCCG 
GCTAAAGGGC GTCGTGAGTT TATTCTCGAT AGCCTTGCTA CTGCTGGGGG ACTGGCGGCT 
GCCATGAGTT TACCCTCGCA AGCATTTGCC AACATGACAC CTCCGGAGGA CGAAGTTGTC 
CGAATTGGTT ATCTCCCGAT CACAGACGCC AGTGCACTTT TGGTTGCGCA TGCCATGGGC 
TTTTTTGAAG ATGAAGGATT AAAAGCCGAA AAGCCAACCT TGATCCGTGG CTGGTCTCCT 
TTGATTGAAG GGTTTGCGGC ACACAAATTT AATTTGGTGC ATTTTTTAAA GCCGATTCCT 
ATTTGGATGC GCTACAACAA CAATTTCCCA GTCAAAATTA CAGGTTGGGC ACATACCAAT 
GGATCTGGTT TAGTGGTCGG AAGACACACC GGAGTCAACT CTTTTGAAGA ACTTGGTGGT 
ATGCAAATAG CCGTTCCATA CTGGTATTCA ATGCATAATA TTGTCTTGCA GATGGCTTTG 
AAAAATGCCG GGCTTGAACC TGTAATCCAG GATCAAACAG ACCCACTCAA ACCAAACCAA 
GTCAACTTAC AAATCATGCC ACCACCAGAC ATGCCACCTG CTTTAGCTGC GAAAAAGATC 
GACGCTTATA TCGTGGCCGA ACCATTCAAT GCCGCTGGAG AAGTCTTAGC CGGTGCAAAA 
ATGCTGCGCT TTACAGGGGA TATCTGGCAA AACCATCCAT GTTGTGTGGT GTGTATGCAT 
GATAATGATG TCGACAAACG TCCAGAATGG TCGCAAAAGG TCATGAACGC TGTGGTAAGA 
GGCGCTTTAT ATGCCCAAGA GAATAAAGAA GAAGTTGCCA AAATGTTGTC CCGTGAAGGA 
AAACGTTATC TGCCGATGAA AGCCAAAGTG GTTCTAAAAG CAATGACGGA TTATTCACCA 
GCGCATTATG AAGATCCTAA AGCGATTAAA CATCCGGACT GGGATGTAGG CCGTATCGAT 
TTCAACCCTT ACCCTTACCC GTCAGCAACC AAATTCATCG TTGACCAACT GAAGGAAACA 
CTGGTTACGG GTGATAAAAC CTTCTTGAAT AATCTAGATA CGGACTTCGT CACAAAAGAC 
TTAGTCAACT ACGATTATGT CAAAAATGCC ATGGACAAAT ATGACGTCTG GGATAAGGTC 
AGAGGAGTCA ATATGGATGA TCCTACCCAT CGAGAAGAGG TGTTCAAGTT ATGA

Protein sequence

MCQYCNCDQE SSELDYQFNP AKGRREFILD SLATAGGLAA AMSLPSQAFA NMTPPEDEVV 
RIGYLPITDA SALLVAHAMG FFEDEGLKAE KPTLIRGWSP LIEGFAAHKF NLVHFLKPIP 
IWMRYNNNFP VKITGWAHTN GSGLVVGRHT GVNSFEELGG MQIAVPYWYS MHNIVLQMAL 
KNAGLEPVIQ DQTDPLKPNQ VNLQIMPPPD MPPALAAKKI DAYIVAEPFN AAGEVLAGAK 
MLRFTGDIWQ NHPCCVVCMH DNDVDKRPEW SQKVMNAVVR GALYAQENKE EVAKMLSREG 
KRYLPMKAKV VLKAMTDYSP AHYEDPKAIK HPDWDVGRID FNPYPYPSAT KFIVDQLKET 
LVTGDKTFLN NLDTDFVTKD LVNYDYVKNA MDKYDVWDKV RGVNMDDPTH REEVFKL