Gene TM1040_2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2043
Symbol
ID	4077970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	2149095
End bp	2150258
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	61%
IMG OID	638007361
Product	hypothetical protein
Protein accession	YP_614037
Protein GI	99081883
COG category	[S] Function unknown
COG ID	[COG3214] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCGAT TAAAAATAGA CAATCGAACC GCCCGCAGCC TGTGGCTTCA GTTGCATGGC 
CTGGCGCAGA CGCCCACCGG GCCTCTGGAT GTACTCGGGC TGATCGAACA GCTTGGCTTC 
GTGCAACTTG ATACCATTCA GGTGGTGTCG CGCGCGCATC ATCACATCCT CTGGAGCCGC 
AATCAGAATT ACCGCGAGCC GATGCTCGAC CCGCTGCTGC GCACGCACCG ACAGGTGTTT 
GAGCATTTCA CCCATGATGC CTCGGTGTTG CCGATGGCGT TTCTGCCCAT GTGGCAGCGG 
CAGTTTGCGC GCAAAAAGCA TCAGGTGAGC CGCTCCAACT GGTTTGGCAA GCATCTGGAC 
CCCGAGCTGA TTTCGGACGT TTTGCGCCGG ATCACGGAGG ACGGCCCGCT CTCCACCAAG 
GACTTTGAGA CCAGGCGTGC GGACAGGACG GCCATGTGGA CCCGCCCGCC GCACAAGATG 
GTGCTCGACT ATCTCTGGTA TGCGGGCGAA CTGGCCACCT CGCATCGGGA GGGCTTTACC 
AAATACTACG ATCTGGCCGA GCGCGTGTAT CCGCAAGACG TGCCTCAGCT GAGCGATCAG 
GCTCAGGTGC AGGGGCTCTG TCATGCGGCG CTTGATCGGA TCGGCTTTGG CACTTTGGGG 
CAGATCCGCA AATTCTGGGA GGCGTGCGCG GTCGAAGAAG TGGCGCGCTG GGCAGAAGAG 
GCGGCGCCCG ATCTGATCGA GGCCGAGGTC GAGGGCGCGG ATGGCAGCTG GTCCAACGTG 
CTGGCCTGCA GCGATATCGA AACCCGCATT GCGGCGCTCT CATCGCCCAC CTCGCGGCTG 
CGCATTCTGA ACCCGTTCGA CCCGGCCATC CGCGATCGCA AGCGGCTGGC GCGGCTGTTT 
GGCTTTGACT ACACAGTTGA AATGTTTGTG CCCGCCGCCA AACGACAGTG GGGGTATTAC 
ATCTACCCGC TCTTGGAGGG CAGCCGCCTG GTGGGCCGCG CCGAGATCAA GGGCGATCGC 
AGCAAGGGTA CGCTCACGCT CAGCAAACTT TGGATGGAAC ATCCGCATTT GAAGACGCCC 
AAACGCCTGC AGAAACTTGA TGCGGAACTT GGCCGCCTTG CACGACTCGC GGGTCTGCAG 
AGGGTGATCT GGGCCGTGGA ATAG

Protein sequence

MARLKIDNRT ARSLWLQLHG LAQTPTGPLD VLGLIEQLGF VQLDTIQVVS RAHHHILWSR 
NQNYREPMLD PLLRTHRQVF EHFTHDASVL PMAFLPMWQR QFARKKHQVS RSNWFGKHLD 
PELISDVLRR ITEDGPLSTK DFETRRADRT AMWTRPPHKM VLDYLWYAGE LATSHREGFT 
KYYDLAERVY PQDVPQLSDQ AQVQGLCHAA LDRIGFGTLG QIRKFWEACA VEEVARWAEE 
AAPDLIEAEV EGADGSWSNV LACSDIETRI AALSSPTSRL RILNPFDPAI RDRKRLARLF 
GFDYTVEMFV PAAKRQWGYY IYPLLEGSRL VGRAEIKGDR SKGTLTLSKL WMEHPHLKTP 
KRLQKLDAEL GRLARLAGLQ RVIWAVE