Gene TM1040_2295 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2295
Symbol
ID	4078479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2414270
End bp	2415799
Gene Length	1530 bp
Protein Length	509 aa
Translation table	11
GC content	61%
IMG OID	638007617
Product	glycosyl transferase family protein
Protein accession	YP_614289
Protein GI	99082135
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGGCC GAACCGCACT GGTGCTGATG GCCGATCCCG CCAGCCTTGC CGCCCTAAGG 
CAGGATCTTC GGGGTCAATT TGATGAGGTG ATCCCAATTC CCACCCCCGC GGCAGAGATT 
GAGGCCATCT TGCTGAGGGC GCTTCAGGCA CAGATGACAC GGGAGGCTGC GCGCAGCGTT 
GCCCCCGCCC TCAGTTGCCG CAGCTTTGAT TACCGCGCTG CCCGCGCCCC AGCCTTTGCA 
ACGGGGACGC TTTTGTGTCT GTTTTCCATT CTCGCGCCGC ATCTTGTGAC TGCGGTGTTG 
GCTGTAGCGT CGCTTGTGAC ATTGCTGATG TTCACGGCCC TCAGGATCTC CGGCCTCTTG 
GCGGCGGCAC GCCCGGACCA GCCGAAATCC GAAACACCCA AGGATCTGCC TCAGATGTCG 
ATGCTGGTGC CGCTCTATCG TGAGGCGGAA ATCGGCAAGC ATCTCTTGCG CCGCCTGTGC 
CGCCTCACCT ATCCGCGCGA CCGCCTTGAG GTATTGCTTG TCCTTGAGGA AAACGACGAT 
GTGACCCGAA ATGCCGTAAA ATGCGCAGAC CTGCCCGATT GGTTCCGGGT GGTCGAGGTG 
CCGGGCGACG GCACGCTCAC CACAAAGCCG CGCGCAATGA ACTATGCGCT GAATTTCTGC 
CGGGGAGAGA TCATCGGGAT CTGGGATGCT GAAGATGCCC CAGCGCCAGA CCAACTCGAG 
AGTGCGGCCA GCGCCTTTGC TCATGCCCCC CCCGACGTGG TGTGCTTTCA GGGAATTCTC 
GATTTCTACA ATCCCAGCCG CAATCTGATT TCGCGCTGCT TTACGCTCGA ATATGCGGGA 
TGGTTTCGCG TCCTGCTCCA AGGCATCGCG CGGCTGGGGC TGGTGATCCC GCTTGGAGGC 
ACCACGCTGT TTATCCGCCG CGACGCGCTC GAACAGCTGG GCGCGTGGGA TGCACATAAC 
GTCACCGAGG ATGCCGACCT TGGCGTGCGG ATTGCGCGCG CGTGCTATCG CACCGAAATG 
CTGCCCACAA CCACCTATGA AGAAGCCAAC AGCCGCATCA CGCCCTGGAT CAAACAGCGG 
TCTCGCTGGC TGAAGGGGTT CATGATGACC TATCTGGTCC ACATGCGCGC CCCAAAGGCA 
CTGTTACGGG ATGTCGGGTG GCGGCGTTTC TGGGGGCTAC AGGCGTTCTT TCTGGGCACC 
CTCGGGCAAT TCCTGCTGGC ACCAGTCCTC TGGAGCTTCT GGCTGGTGGC GCTCGGAGTA 
TCGCATCCGC TCGAAGCGTC ACTGCCCCGG GATATGCTGT CTGTCGCTGT CGGGGCGCTT 
GTGTTCTTTG AGGTGCTCAA CCTGTGCATC TGGTATTGCG GCGCACGGGC TTCGGGGCGG 
CCAGTCCTCG CGTTCTGCGC GCCCCTGATG CCTCTCTATT TCATACTTGG CTGTTTTGCC 
GCCTACAAAG CCCTCTGGGA GGTGTTCGCA GCGCCGTTTT TCTGGGACAA GACCGCGCAT 
GGGGATCATG GCGGCACCAC AGAGCATTGA

Protein sequence

MLGRTALVLM ADPASLAALR QDLRGQFDEV IPIPTPAAEI EAILLRALQA QMTREAARSV 
APALSCRSFD YRAARAPAFA TGTLLCLFSI LAPHLVTAVL AVASLVTLLM FTALRISGLL 
AAARPDQPKS ETPKDLPQMS MLVPLYREAE IGKHLLRRLC RLTYPRDRLE VLLVLEENDD 
VTRNAVKCAD LPDWFRVVEV PGDGTLTTKP RAMNYALNFC RGEIIGIWDA EDAPAPDQLE 
SAASAFAHAP PDVVCFQGIL DFYNPSRNLI SRCFTLEYAG WFRVLLQGIA RLGLVIPLGG 
TTLFIRRDAL EQLGAWDAHN VTEDADLGVR IARACYRTEM LPTTTYEEAN SRITPWIKQR 
SRWLKGFMMT YLVHMRAPKA LLRDVGWRRF WGLQAFFLGT LGQFLLAPVL WSFWLVALGV 
SHPLEASLPR DMLSVAVGAL VFFEVLNLCI WYCGARASGR PVLAFCAPLM PLYFILGCFA 
AYKALWEVFA APFFWDKTAH GDHGGTTEH