Gene TM1040_3689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3689
Symbol
ID	4075658
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	750163
End bp	751407
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	64%
IMG OID	638005209
Product	glycosyl transferase, group 1
Protein accession	YP_611918
Protein GI	99078660
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.466266
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.187253
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGGAA AACGCCCCGC GCTTGCTGTG TTGGTCAAAG GCTGGCCGCG CCTTTCCGAG 
ACCTTTATCG CGCAGGAACT TGTCGCTCTT GAGGCGGCGG GGCAGCCTTT TGAGATTTGG 
TCGCTGCGTC ACCCCACCGA CACCAAAACT CACCCGCTTC ATGATCGCCT CCAGGCACCG 
GTGCATTACC TGCCGGAGTA TCTCTATGAT GCGCCCGCTC GGGTGGCCGA GGCTCGCACT 
CGGGCGCAGA CGCTGCCGGG CTACGCGGCG GCCTACGAAG TCTGGCGCGC TGATCTGCGC 
CGCGACCCGA CGCACAACCG CATTCGCCGC TTTGGTCAGG CCTGTGTCCT GGCGGCGGAA 
CTGCCGCCCG AGGTGCGCGG CCTTTATGCC CATTTCCTGC ATACGCCCGC TTCGGTGGCG 
CGCTATGCCG CAATCATGCG GGGCCTGCCG TGGAGCTTTT CGGCCCATGC AAAAGACATC 
TGGACCTCGC CCGAATGGGA GTTGCGCGAA AAGCTCTCGG CGGCCAGCCA TGGCGCGGCC 
TTTGGGGCCA CCTGCACAGG GTTTGGCGCG AAGCATCTAC AAGAGCTCTC TGACGGCACG 
CCTGTGGATC TGATCTATCA CGGGCTTGAT CTGTCGCGGT TCCCCGCCCC CCCTGCGCGT 
GTACTGCGCA GCCCGAATGC GCCGTTTCAC ATGATGTCGG TGGGGCGGCT GGTGGAGAAG 
AAAGGCTTTG ACCGCTTGAT CGCCGCGCTT GCGCTCCTGC CTCGGGATCT TGACTGGCAC 
TGGACCCATA TCGGTGGTGG CGGACTTGGG GATCTGTTGC AGGGCATGGC CGAAGACGCA 
GGCATTTCTG CTCGTATCAC ATGGCGCGGC GCCTGCGATC AGCCCGAGGT GATTGATGCG 
ATGCGTGCGG CGGATCTCTT TGTGCTGCCT TCCCGTGTGG CTTCGGATGG CGACCGCGAC 
GGCTTGCCCA ATGTGCTGAT GGAGGCGGCT TCGCAAGGCC TGCCGATCCT CTCGACCCCG 
GTGTCGGCTA TTCCCGAGTT CATCGAAAGT GGCACCCATG GCCTCCTCAG CAGCGACGCG 
CCCGAGGCTT TGGCGGACGC GATGCTGCGT TTGGCCCATG CGCCCGAAGA GGCGCAGCGC 
ATGGCCAAAG CCGCGCTTCT GCGTCTGCGC GCTGAGTTTG GCATGGATCC GGGTATTGCG 
CAGTTGAACA CGCGCCTCAA TGCGATGCTG AAGGACGCTG GATGA

Protein sequence

MTGKRPALAV LVKGWPRLSE TFIAQELVAL EAAGQPFEIW SLRHPTDTKT HPLHDRLQAP 
VHYLPEYLYD APARVAEART RAQTLPGYAA AYEVWRADLR RDPTHNRIRR FGQACVLAAE 
LPPEVRGLYA HFLHTPASVA RYAAIMRGLP WSFSAHAKDI WTSPEWELRE KLSAASHGAA 
FGATCTGFGA KHLQELSDGT PVDLIYHGLD LSRFPAPPAR VLRSPNAPFH MMSVGRLVEK 
KGFDRLIAAL ALLPRDLDWH WTHIGGGGLG DLLQGMAEDA GISARITWRG ACDQPEVIDA 
MRAADLFVLP SRVASDGDRD GLPNVLMEAA SQGLPILSTP VSAIPEFIES GTHGLLSSDA 
PEALADAMLR LAHAPEEAQR MAKAALLRLR AEFGMDPGIA QLNTRLNAML KDAG