Gene TM1040_3036 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3036
Symbol
ID	4075741
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	-
Start bp	3409
End bp	4425
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	59%
IMG OID	638004537
Product	sulfonate ABC transporter, periplamic sulfonate-binding protein
Protein accession	YP_611272
Protein GI	99078014
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTCA ACAGACGACA GACATTGGCG CTAATGGGCG CCGCCGCTGC ATCAGGCCTC 
GCCGCTCCGG CGCTTGCTTC TGGCAAAAAA CCGGTGGTGG GCGCGCTGAG CCTCACGAGC 
CATTCTGGCA GCTTTATCGC GCTGGAGCGG GGATATTTCA AAGAGGCGGG CCTCGATGTC 
GAGCTCAAGT TCTTTCAAGC CGCACAGCCC ATGGCCGTTG CCATCGCCTC CGGTGACGTA 
GATTTCGGCG TTACCGCGAT TTCCGGCGGC CTCTTGAGCC TTGCAGACAA AGGCGCGGTC 
AAGGTGATTG GCGGCGCGCT ATCCGAGGAA CCCGGCATCG ACGGGCAGAA GATCCTTGCC 
TCTGATGCAG CCTATCAAGC GGGGCTCACG TCGGTCGCGG CTCTGGATGG CAAACGCTAC 
GGGATGACCA CTGCGGGATC GTCCTTTCAC TACATGGGCT CCAAGATCGC TGGCGCTGAA 
GGCGGGACGC CGCAGTTTGT GCCACTGCAA AAGGTTGGCG CGATTATTGG CGCGCTGAAA 
TCGGGTCAGA TTGATGCCTG GTCCATCGTA CCCCATATCG CAAAGCCGCT CGCAGGCTCG 
GGCGCGGTGC ATATCATCGG CAATGTCGCG GACTATCTGC CGAATTACCA GGTCACAACT 
GTCTTTACCT CTGCGCAGAA CGCGAGCAAG GAACGCGGTC TGACAGAGAG CTTCCTCAAG 
GGCTTTGGCA TGGGGGTGTC GGATTACAAC GCCACCATGG TCGACAAGCA AAACGGTGAG 
GACGCCATCA ACGAGATGGT CGATCTGATC CACAAATATG TCTACACCGA CCGCCCGCGC 
GAAAAAGCAG CGCCGTCGAT CATCAATGGG TCCATGCGTC TCAACAAAGA TGCTGCGATC 
AATGTGGCCT CGGTGTCTGA TCAGCTGGCC TGGATGCAGT CGGAGGGCCT TGTCGATGCC 
GGGATCACGC TCGAGACCTT CCTCGATACC AGCTACGTCG ATGTGATCGG CGCCTAA

Protein sequence

MTFNRRQTLA LMGAAAASGL AAPALASGKK PVVGALSLTS HSGSFIALER GYFKEAGLDV 
ELKFFQAAQP MAVAIASGDV DFGVTAISGG LLSLADKGAV KVIGGALSEE PGIDGQKILA 
SDAAYQAGLT SVAALDGKRY GMTTAGSSFH YMGSKIAGAE GGTPQFVPLQ KVGAIIGALK 
SGQIDAWSIV PHIAKPLAGS GAVHIIGNVA DYLPNYQVTT VFTSAQNASK ERGLTESFLK 
GFGMGVSDYN ATMVDKQNGE DAINEMVDLI HKYVYTDRPR EKAAPSIING SMRLNKDAAI 
NVASVSDQLA WMQSEGLVDA GITLETFLDT SYVDVIGA