Gene TM1040_2134 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2134
Symbol
ID	4076448
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2239477
End bp	2241516
Gene Length	2040 bp
Protein Length	679 aa
Translation table	11
GC content	63%
IMG OID	638007454
Product	capsule polysaccharide biosynthesis
Protein accession	YP_614128
Protein GI	99081974
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3563] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCAAG GGCCTTTGCC GCATCTGGAC GAGACCAGAA CCGGGAGCAA ACGCTCCCGG 
TTGTTTGTGT ATAACGGAGG GTTTCTGACC CAGTCCCGTG TCCGGCGCAT TCTTGATCTA 
GCGGGCTATG ACATTCGTCT GGGCCTGCCC AAAGAGGGCG ATCTGGTCGG GATCTGGGGC 
AACAGCCCCA CCGCCCATCG CGGCCGCAAG ATTGCCCAAG AGCATAACGC GCCCTTGGTG 
CGCATTGAGG ATGCGTTCCT GCGCTCGGTG CATCCGGGCC GCGATGGCGA GCCCCCGATG 
GGATTGCTGA TTGACCGCGC TGGCGTGCAT TTTGACCCGG CCCTTCCAAG CGACCTCATC 
ACGCTCCTGA AAGAACACCC ACTCGATGAC AGCGCCTTGA TGAAGCGCGC GCGCGACGCC 
ATGGCAAGGC TTCAGGACGC GCATCTGAGC AAATACAACG CCTTCCATCC CGATGTTCCC 
CCACCAGAAC CCGGCTACGT GCTGGTGGTG GATCAATTGC GCGACGATGC GTCCGTCAAG 
GCCTCGATCC CCTTCCCCGG CGCGGACCGG GGACGCTTTC AGGAAATGCT GGCCTTTGCG 
CGCGAAGAAA ACCCCGGCGC GCGCGTATTG ATCAAGACCC ATCCGGAAAC CACCAAGGGC 
CACCGTGCCG GCTATTTCGA CGCGCGTGAC ACCAATGATC AGGTGGAACT CTTTGATGCG 
CCAGTCTCGC CACATCTGCT GCTCGAGGGC GCTGTGGGCG TCTATACCGT GTCGTCGCAA 
CTCGGGTTCG AGGCCATCCT TTCCGGGCAC AGGCCGCGTA TCTTTGGCCA GCCTTTCTAT 
GCCGGATGGG GCCTGACGCA GGATGAGTTC CCCCCCGCGG GGCGTCATCG TCGCCTGACC 
CGCGCACAGC TTTTTGCGGC GGCCATGATC CTCTTTCCCA CCTGGTATGA TCCCCATCAC 
GACCGGCTTT GCGAGCTGGA GGACGTGATC GACTCTCTGG AGGCGCAGGT CCGGGCCTGG 
CGCGAAGACC GCGCTGGCTG GGCTGCCTCA GAGATGCGTC TGTGGAAGCG CGCGCCCTTG 
CAGCAGTTCT TCGGGCGCCA CAAGCGCATG AGTTTCACCG AAAAAACCGC AACTGCCAAA 
AAGAGCGGCA AGAACTGGAT GGTCTGGGCC AGCAAGGCGA CCAAGGATCA CGCCGGGGCG 
CATCATCTGG AAGATGGATT CTTGCGCTCG CGGGGGCTCG GGGCTGAACT GGTGCCGCCC 
TTGTCATTGG TGCTGGATCG TCAGGGCATT TATTATGACC CGACCCGTCA CAGTGATCTG 
GATGACCTGA TCCGCGAACG CGTCACGCTG AGCCCGCAGC AGGAACGCCG GATCGAGGCG 
CTGGTGATGC GGCTCATCAA ACATGAGGTG ACAAAATACA ATCTCGATGG CGCACTGCCC 
GATTTGCCCA AAGGGCATCG GGTTCTGGTG CCCGGCCAGG TCGAGGATGA TGCCTCCCTG 
CGGCTCGGAG CGGGTAAGAT CAACACCAAT ATGAAGCTGT TGCAGGCCGT GCGGGCTGCG 
CGCCCGAATG CGGTCGTGAT TTACAAACCG CACCCGGATG TGGAGGCAGG CCTGCGCAAG 
GGCCGCATCA GCCACGCCGA GGCCTGGGCG GATGTGGTGG CAGAGCATGC CAACCCGGCG 
GCGCTGATCG ACAGTGTCGA TGAGGTCTGG ACCATGACGT CGCTCCTGGG GTTTGAGGCT 
TTGTTGCGGC GGGTGCCGGT CACCTGTGTG GGGCTGCCGT TTTATGCTGG ATGGGGGCTG 
ACGCGGGATC GGCTTCAGGC GCCCCATTGG CGCGATGCGC GCCCTGGTAT CCTTGGGCTC 
GCCCATGCGG CGCTCATCGA CTATCCGCGC TATTTTGATC CGGTCTCAAA GCTGCCCTGC 
GCGCCCGAGG TTGCTGTCGA TCGGCTGATT GCCGGAGAGC TGCCTGCGCG CAGCCCCCTG 
AACAGCAGCC TCTCGAAATT GCAGGGGCTC TTTGCCTCAT TTGCTCCGCT CTGGCGCTGA

Protein sequence

MMQGPLPHLD ETRTGSKRSR LFVYNGGFLT QSRVRRILDL AGYDIRLGLP KEGDLVGIWG 
NSPTAHRGRK IAQEHNAPLV RIEDAFLRSV HPGRDGEPPM GLLIDRAGVH FDPALPSDLI 
TLLKEHPLDD SALMKRARDA MARLQDAHLS KYNAFHPDVP PPEPGYVLVV DQLRDDASVK 
ASIPFPGADR GRFQEMLAFA REENPGARVL IKTHPETTKG HRAGYFDARD TNDQVELFDA 
PVSPHLLLEG AVGVYTVSSQ LGFEAILSGH RPRIFGQPFY AGWGLTQDEF PPAGRHRRLT 
RAQLFAAAMI LFPTWYDPHH DRLCELEDVI DSLEAQVRAW REDRAGWAAS EMRLWKRAPL 
QQFFGRHKRM SFTEKTATAK KSGKNWMVWA SKATKDHAGA HHLEDGFLRS RGLGAELVPP 
LSLVLDRQGI YYDPTRHSDL DDLIRERVTL SPQQERRIEA LVMRLIKHEV TKYNLDGALP 
DLPKGHRVLV PGQVEDDASL RLGAGKINTN MKLLQAVRAA RPNAVVIYKP HPDVEAGLRK 
GRISHAEAWA DVVAEHANPA ALIDSVDEVW TMTSLLGFEA LLRRVPVTCV GLPFYAGWGL 
TRDRLQAPHW RDARPGILGL AHAALIDYPR YFDPVSKLPC APEVAVDRLI AGELPARSPL 
NSSLSKLQGL FASFAPLWR