Gene TM1040_2132 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2132
Symbol
ID	4076446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2236933
End bp	2238237
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	62%
IMG OID	638007452
Product	capsule polysaccharide biosynthesis
Protein accession	YP_614126
Protein GI	99081972
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3562] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAATGA GATCGAAAAA TGGATCAGCT GACGCCCGCA GCTTCCTGTT TCTGCAGGGG 
CCTCATGGGC CGTTTTTTGC AGCTCTGGGG CGTATGTTGC GCGCAGCGGG CTGCAGCGTG 
CACCGGGTTG GGTTCAACAC GGGCGACCGC GTGTTCTGGC CGGACCGGCA AAGCTATATC 
GCCTATCGCG ATACACCAGA GGCCTGGCCG GAAAGGTTTG GCGCGCTCCT GGATCAGCGC 
GCGATCACCG ATATCGTGCT CTATGGCGAC ACCCGCCCGA TCCATGCGGA TGCAATCGCG 
ATCGCAAAGG CACGCGGTAT CACAGTCCAT ACGTTCGAAG AAGGCTATCT GCGCCCCTAC 
TGGGTCACCT ATGAGCGCGA CGGCACCAAT GGCAACTCGC GCCTGATGCA GATGCCGGTC 
CCTGAGATGG AGCAAGCGCT GGCAAACAGC GACCTCGAAA TGCCAATGCC TCCGGCGCAT 
TGGGGCGACA CACGCCAACA TGTGATTTAC GGCGCGCTTT ATCATTGGTT CGTCATGTTT 
CTGAACCGGG GCTATCGCAA CTTCCGCCCC CATCGCGCCC TGCCGGTCAC AAAGGAGTTC 
CAGCTCTATC TCAACCGGCT GCTGATGATG CCCTTGCATG CCTTGCACCG CCGTCTGGCC 
ACGATGCGCA TTCAGCGCGG CGGATTTCCC TATCATCTGG CGCTCTTGCA GCTGGAACAT 
GACAGCGCGT TTCAAGCCCA TTCGCCTTTT TCGACCATCA CCGAATTCCT CGAGGTGGTT 
GTTGCCGGCT TTGCCGAGGG CGCGCCGCGC CACCACCACC TTGTCTTCAA GGCGCACCCG 
CTTGAGGATG GACGCGCCCC GATCCGACGG GCGTTGAAAC GTCTGGCCGC GGAACATGGC 
GTCGAGGGGC GCGTGCACTA TGTGCGCGGC GGCAAGCTCG CCGCGCTTTT GAATGAGGCG 
CGCACCGCCG TCACCGTGAA CTCCACGGCA GGCCAACAGG TCTTGTGGCG GGGCTTGCCG 
CTCAAGGTCT TTGGCCGCGC GGTTTATGAC AAACCGGAAT TCTCCTCGAC CCAAAGCCTG 
CCGGAGTTCT TTGCCGCTCC CGCCCGCCCC GATGGGCGCG CCTACAAGCA ATATCGCCGC 
TATCTTTTGG AAACCTCTCA GTTTCCTGGC GGGTTTTATT CGCGCTCCGG GCGGCGCCAG 
CTGTTGCGGC AAGTGGTGGA TATGATGCTT GCTGCCGACG ATCCCTATGA CGCGCTCCTG 
CGCGGCACAG CAGCGCCACG GCAACACTTG CGTGTCGTGA GCTGA

Protein sequence

MPMRSKNGSA DARSFLFLQG PHGPFFAALG RMLRAAGCSV HRVGFNTGDR VFWPDRQSYI 
AYRDTPEAWP ERFGALLDQR AITDIVLYGD TRPIHADAIA IAKARGITVH TFEEGYLRPY 
WVTYERDGTN GNSRLMQMPV PEMEQALANS DLEMPMPPAH WGDTRQHVIY GALYHWFVMF 
LNRGYRNFRP HRALPVTKEF QLYLNRLLMM PLHALHRRLA TMRIQRGGFP YHLALLQLEH 
DSAFQAHSPF STITEFLEVV VAGFAEGAPR HHHLVFKAHP LEDGRAPIRR ALKRLAAEHG 
VEGRVHYVRG GKLAALLNEA RTAVTVNSTA GQQVLWRGLP LKVFGRAVYD KPEFSSTQSL 
PEFFAAPARP DGRAYKQYRR YLLETSQFPG GFYSRSGRRQ LLRQVVDMML AADDPYDALL 
RGTAAPRQHL RVVS