Gene TM1040_2784 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2784
Symbol
ID	4076552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2944029
End bp	2945063
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	58%
IMG OID	638008109
Product	twin-arginine translocation pathway signal
Protein accession	YP_614778
Protein GI	99082624
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG4663] TRAP-type mannitol/chloroaromatic compound transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.968242
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACAC GTCGTAATTT TCTAAAGACC ACCGCCTTGG GCGCTGCCGC TGCACCGCTT 
GCAGCGCCTG CGCTGGCGTC TGGTAAGATC ACATGGCGGA TGCAGACCTA CGCCGGTCCC 
GCGCTTGCAG CGCATGTGAT CGACCCGGCG ATTGAAATGT TCAACAAGAT CGCAGGCGAC 
CGCATGCAGA TCGAGCTTTT CTACGCCGAC CAGCTGGTCC CCACGGGTGA GCTGTTCCGT 
GCCATGCAGA AAGGCACCAT CGACGCGGTA CAGTCTGATG ACGATTCCAT GGCGTCTCCG 
ACAGAAGTGA CCGTTTTTGG CGGCTATTTC CCCTTTGCGT CGCGCTACTC GCTCGACGTG 
CCGGTGCTGT TCAACCAGTA CGGCCTCAAC GAGATCTGGG ATGCGGAATA CTCCAAGGTG 
GGCGTCAAGC ACATCTCCGC AGGCGCTTGG GATCCTTGCC ACTTTGCCAC CAAAGATCCG 
ATCAACTCGC TTGAGGATCT CAAGGGCAAG CGCGTCTTCA CCTTCCCGAC TGCGGGCCGC 
TTCCTGAGCC AGTTCGGCGT CGTGCCTGTC ACCCTGCCGT GGGAAGACAT CGAAGTTGCA 
ATGCAGACCG GCGAGTTGGA TGGCGTTGCT TGGTCGGGCA TTACCGAAGA TTACACCGTG 
GGTTGGGCCG ATGTGACCAA CTACTTCCTG ACCAACAACA TTTCCGGTGC ATGGGCAGGC 
AGCTTCTTTG CCAACATGGA CCGTTGGAAC GAGCTGCCCG AAGATCTGCA GGCGCTGTTC 
CGTGTCTGCA CCGACCAGTC GCATTACTAT CGCCAGTGGT GGTACTGGGG TGGCGAAGCC 
TCCTTGCGCG TCAATGGCGA CAAGATGAAG CTGACCTCGA TCCCCGATGC AGAATGGCAG 
CAGGTCGAAG ATGCCGCGGT AAAGTTCTGG GACGAGATCG CAGCCGAATC CGAAACCAAG 
GCGAAGGTTG TCGAGATCTT CAAGAAGTAC AACGCCGATA TGGCGAAAGC CGGTCGTCCG 
TATCGTTACG GCTGA

Protein sequence

MTTRRNFLKT TALGAAAAPL AAPALASGKI TWRMQTYAGP ALAAHVIDPA IEMFNKIAGD 
RMQIELFYAD QLVPTGELFR AMQKGTIDAV QSDDDSMASP TEVTVFGGYF PFASRYSLDV 
PVLFNQYGLN EIWDAEYSKV GVKHISAGAW DPCHFATKDP INSLEDLKGK RVFTFPTAGR 
FLSQFGVVPV TLPWEDIEVA MQTGELDGVA WSGITEDYTV GWADVTNYFL TNNISGAWAG 
SFFANMDRWN ELPEDLQALF RVCTDQSHYY RQWWYWGGEA SLRVNGDKMK LTSIPDAEWQ 
QVEDAAVKFW DEIAAESETK AKVVEIFKKY NADMAKAGRP YRYG