Gene TM1040_3690 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_3690
Symbol
ID	4075659
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008043
Strand	+
Start bp	751404
End bp	752513
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	65%
IMG OID	638005210
Product	glycosyl transferase, group 1
Protein accession	YP_611919
Protein GI	99078661
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.633764
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCAT CCCGTATCGC CTTTTATGCG CCCATGAAGG CTCCGACTCA TCCTACGCCC 
TCTGGCGATC GCGCGATGGC TCAGAACCTG ATGGAGCTTT TGCAATTGGG CGGTGCGGAG 
GTGATCCTCG CCTCAGAGCT GCGGCTTTAT GATAAACTGG GCGACCCCGC GCATCAGCAG 
CTATTGCAGC GGCGCGCCGC TGATGAGGTC AGCCGTCTGG TCGAGGAGCT TCCGCCCGTG 
GACGCTTGGG TGACCTATCA CAATTACTAC AAAGCCCCCG ATTTGCTCGG ACCCGCCGTG 
GCCGAGGCCC GGGGCATTCC CTACGTGCAG ATCGAGAGCA CGCGCGCCAA GAAACGCCTG 
AAGGGGCCTT GGGCCGCATT TGCGCAGGCC GCCCACGAGG CCGCTGATCA GGCCGCGGTG 
ATCTTCTACC TCACGGACCA GGACCGACAG ACGTTGGAGC GCGATCGCGC AGGCGATCAA 
CAGCTGGTGC ATCTGCGCCC GTTTCTGCCG CAGGATGTGC TGCCTCCGGC AAGGGCAGAG 
TCAGACGACG CAGGCCGTAC ACTGCTGGCC GCTGGCATGA TGCGTCCGGG CGACAAACTG 
GCGTCATATG CCCTTATTGC CGAGACGCTG CGCCACCTTG AGAAGACCGA GCGCGCGAGC 
GACTGGCAGC TTTTGATTGC GGGCGACGGC CCCGCGCGCA CCGAGGTCGA CGCGCTCATG 
GCGCCCTTTG GCGACCGGGT GCGTTTTCTC GGACAGCTCG GCCCCGAGGC CATGATAGAC 
GCGTATCGTG CCGCAGATCT TTTCCTGTGG CCCGGCGTCA ACGAAGCCTT CGGGATGGTC 
TATGTCGAGG CCCAATCTCA TGGTCTACCT GTGGTCGCTC AAGACAGGCC CGGCTTGCGG 
GATGTGCTTT TGCCCGGGGA TTATCCCGCT CCAGATGCTG GCGCGCGCGC CCTTGCCGCC 
CGTGTGGTGC ACCTGCTGGC GGATGCGTCT GAGCGCAAAG ACCTCGGGCG GCGGGCGCGG 
GATCATATCG CCCGCCACCA CCTTCGCCCC GCCGCGTCCG CAACCCTCTG GGCGGCGCTC 
AAGCCACTAT TTAGGGAACA CAGCGCATGA

Protein sequence

MSASRIAFYA PMKAPTHPTP SGDRAMAQNL MELLQLGGAE VILASELRLY DKLGDPAHQQ 
LLQRRAADEV SRLVEELPPV DAWVTYHNYY KAPDLLGPAV AEARGIPYVQ IESTRAKKRL 
KGPWAAFAQA AHEAADQAAV IFYLTDQDRQ TLERDRAGDQ QLVHLRPFLP QDVLPPARAE 
SDDAGRTLLA AGMMRPGDKL ASYALIAETL RHLEKTERAS DWQLLIAGDG PARTEVDALM 
APFGDRVRFL GQLGPEAMID AYRAADLFLW PGVNEAFGMV YVEAQSHGLP VVAQDRPGLR 
DVLLPGDYPA PDAGARALAA RVVHLLADAS ERKDLGRRAR DHIARHHLRP AASATLWAAL 
KPLFREHSA