Gene TM1040_2321 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2321
Symbol
ID	4078311
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2441144
End bp	2442754
Gene Length	1611 bp
Protein Length	536 aa
Translation table	11
GC content	61%
IMG OID	638007643
Product	sulphate transporter
Protein accession	YP_614315
Protein GI	99082161
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACGCG GCGTATTGGG CCTTTTGGCC AAGAATATCT CTCCTCCCAA TCTTTCCATC 
ATGCAGGATG AGGGTTTTAC GGTGGCGCGT GTGCGCACCG AGCTGTTGTC CGGGCTGACG 
GTGGCCCTGG CGCTGGTGCC GGAGGCGGTG GCCTTTGCCT TTGTGGCTGG GGTGCATCCT 
CTGGTGGGGC TCTATGCGGC CTTTCTGGTG GGGCTGATCA CGGCGCTCAT CGGGGGGCGT 
CCGGGCATGA TTTCGGGGGC GACCGGAGCG CTGGCAGTGG TGATGGTGGC GCTGGTGGCC 
GAGCACGGGG TGGAGTATCT CTTTGCCACC GTGGTTTTGA TGGGCATCCT GCAGGTCATC 
GCCGGTGTCA TGCATTGGGG CAAGTTCATC CGACTGGTGC CGCATCCGGT GATGCTTGGC 
TTTGTGAACG GTCTGGCGAT CGTGATTTTC CTAGCGCAGC TTACGCAGTT CAAGCAACCC 
GGCACCGGGG GCGAAGAATG GCTTGCCGGG CCGCAGCTTC TGATGATGCT GGGGCTTGTG 
GTGCTGACCA TGGTGATCAT CTGGGGCATG CCCAAGCTGA CCAAGGTGAT CCCGGCGCCG 
CTGGCGGGGA TCGGGATTAC AGCGATCATC GTGATCGCCT TTGGTCTTGA TGTGCCGCGC 
GTGGGCGACA TGGCGTCCAT CGAGGGGGGC TTGCCAAGCT TTCACGTGCC GATGGTGCCG 
TTCAACATGG AAACGCTGCA GATCATCCTG CCCTATGCGG TCATCCTGGC GGCGATTGGC 
CTCATCGAGA GTCTTTTGAC CCTGAACCTT GTGGGCGAAA TCACCGGCAA GCGGGGCGGC 
GCGAGCCAGG AGTGCATCGC GCAGGGGACA TCGAATATTG TTACCGGTTT CTTTGGCGGC 
ATGGGCGGTT GTGCGATGAT TGGTCAGTCG ATGATCAACG TGAATTCGGG CGGGCGCACG 
CGGATCGCGG CGATTGCGGC AGCCCTGTTT CTGTTGCTGT TCATCGTGGC GGCCTCTCCG 
CTGATTGAAC AGATCCCGCT GGCAGCGCTC GTGGGCGTGA TGTTCATGGT GGTGATCGGG 
ACATTTGCGT GGAACAGCTT CAAGATCATG ACCAAGGTAC CGCTGACGGA TGCCTTTGTG 
ATCGTGCTGG TGACCGTGGT CACGGTGATG ACCGACCTTG CGATCGCTGT TGTGGTCGGG 
GTCATCGTGT CGGCGCTGGC CTACGCGTGG AACAACGCGC GGCGCATTCA CGCGATCACC 
CGCGACAGCG TGAGCGAGAA AGGCGCCAAG GTCTATGAGA TCCAGGGGCC GCTGTTCTTT 
GGCTCGACCG ACGGGTTCAT CGAGCTCTTT GACGTAGAAA ACGATCCCGA CGTGGTGATC 
GTGGACTTTG CGGCCTCGCG GGTTGTGGAT CAGTCGGCGC TGCAGGCCAT CGAGGCTGTG 
GCCGGAAAAT ACGAGGCCGC TGGCAAGGCG CTGCAACTGC GTCACCTGAG CCGCGATTGT 
CACGAGCTCC TGTCCAAGGC CGGGCATCTG ATGGTCGATA GCGACGATGA TCCGGAATAT 
GGCCTCGCGG TGGACTACTC GGTCAAAACC GGGGTTCTGG GCGGTCACTA A

Protein sequence

MTRGVLGLLA KNISPPNLSI MQDEGFTVAR VRTELLSGLT VALALVPEAV AFAFVAGVHP 
LVGLYAAFLV GLITALIGGR PGMISGATGA LAVVMVALVA EHGVEYLFAT VVLMGILQVI 
AGVMHWGKFI RLVPHPVMLG FVNGLAIVIF LAQLTQFKQP GTGGEEWLAG PQLLMMLGLV 
VLTMVIIWGM PKLTKVIPAP LAGIGITAII VIAFGLDVPR VGDMASIEGG LPSFHVPMVP 
FNMETLQIIL PYAVILAAIG LIESLLTLNL VGEITGKRGG ASQECIAQGT SNIVTGFFGG 
MGGCAMIGQS MINVNSGGRT RIAAIAAALF LLLFIVAASP LIEQIPLAAL VGVMFMVVIG 
TFAWNSFKIM TKVPLTDAFV IVLVTVVTVM TDLAIAVVVG VIVSALAYAW NNARRIHAIT 
RDSVSEKGAK VYEIQGPLFF GSTDGFIELF DVENDPDVVI VDFAASRVVD QSALQAIEAV 
AGKYEAAGKA LQLRHLSRDC HELLSKAGHL MVDSDDDPEY GLAVDYSVKT GVLGGH