Gene TM1040_2133 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2133
Symbol
ID	4076447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2238343
End bp	2239470
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	62%
IMG OID	638007453
Product	polysaccharide export protein
Protein accession	YP_614127
Protein GI	99081973
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1596] Periplasmic protein involved in polysaccharide export
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTTAC GGTGGGCGCG CCCCGTGGCC TTGTTGGCTG CGGTTGCCCT CGCAGCATCA 
TGCGGGCTGC CCAAGGTGGG CCCGAACAAA CGTGAGATCT TTGCAGGGTC GGTACAAAAA 
CAGGGCGATG CCTTTGTGGT CTCGGTCAAC GACCGCGTTG CCCGGGCAAC AGCCGTGGTA 
CCCGCACTTG GGTTTTCCGA CGCCTTCACC AAAGCATCGG TTCTTACCTC CGACATCATT 
CGCCCCGGCG ATATCCTTGG CCTGACGATC TGGGAAAACG TCGACGACGG GCTGCTTGCC 
AGCGCCGGCG CCAATGCCAC CCTTCTCGAA GAAGTGCAGG TTGATGGTGC GGGCTTCATC 
TTTGTGCCCT ACGCAGGCCG CGTGCGCGCC TCGGGCAATA CGCCAGAGCA GTTGCGCGAA 
GCCATCACCA AGAAGCTCGA AGACCAGACG CCCGACCCGC AGGTTCAGGT GCGCCGCCTT 
GCCGGCGATG GCGCCACAGT CAGCCTCACC GGAGCGGTGG GCGCGCAGGG GGTCTATCCA 
ATCGAACGTC CGACGCGCAC TCTGGCCACC ATGCTGGCGC AAGCTGGCGG CGTGGCGATC 
GAACCCGAGA TTGCGCAGGT CTCTGTGACC CGCCAAGGGC AGACTGGCAC GATCTGGTTC 
GAGGACCTCT ACGACCACCC CCAGATGGAC ATCGCGCTGC GCAATGGCGA CAAGATCCTT 
GTGGAAGGCG ATACGCGCTC CTTTACCGCG CTGGGAGCGA CCGCGGCGCA GGCCCGTGTA 
CCTTTCGAGA GCCAGAACCT CTCGGCGCTT GAAGCTCTTG CACAGGTCGG CGGCCTGATC 
GCCACGGCAT CCGATCCCAC CGGTGTCTTT GTCTTCCGCA ATGAACCTGA AGCGATCTCA 
AATCAGGTGC TTGGGCGTGA CGATCTGATC GGCGCGCAGC GCATGATCTA CGTGCTGAAC 
CTCACTCAGC CCAACGGTCT CTTCATTGCC CGCGACTTCG TGATCCGCGA TGGCGACACC 
ATCTATGTGA CCGAAGCACC CTATGCCCAA TGGACCAAGA CGCTGTCTCT TCTGACCAGC 
CCGCTGTCCA CGGCTGCAAG TGTCGAGACC CTGTTCGGCG GCAGTTAA

Protein sequence

MTLRWARPVA LLAAVALAAS CGLPKVGPNK REIFAGSVQK QGDAFVVSVN DRVARATAVV 
PALGFSDAFT KASVLTSDII RPGDILGLTI WENVDDGLLA SAGANATLLE EVQVDGAGFI 
FVPYAGRVRA SGNTPEQLRE AITKKLEDQT PDPQVQVRRL AGDGATVSLT GAVGAQGVYP 
IERPTRTLAT MLAQAGGVAI EPEIAQVSVT RQGQTGTIWF EDLYDHPQMD IALRNGDKIL 
VEGDTRSFTA LGATAAQARV PFESQNLSAL EALAQVGGLI ATASDPTGVF VFRNEPEAIS 
NQVLGRDDLI GAQRMIYVLN LTQPNGLFIA RDFVIRDGDT IYVTEAPYAQ WTKTLSLLTS 
PLSTAASVET LFGGS