Gene TM1040_1929 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1929
Symbol
ID	4076880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2028463
End bp	2029653
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	61%
IMG OID	638007245
Product	toxic anion resistance
Protein accession	YP_613924
Protein GI	99081770
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3853] Uncharacterized protein involved in tellurite resistance
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.414661
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.613644
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAA CGATTCAACA AAAAGCAGTA GAAGCCGAAA CGCTGGTGAA GGAAGTAACC 
GAAGTGTCCC TGCCCGACCC CAAGGGCGAG CTGGCCACGC TCGAGGCCGC CGACCCGGAA 
ACCACCACAG CGATCCGCCG CCGCATCGAC GAGATCGACA TGGGCGATAC CAATTCGATC 
ATCTCCTTTG GCTCTGCCGC GCAGGGTGAA CTGCAACAGA TCTCGCAGGC GATGCTGACG 
GATGTGCGCA ACAAGGACGT GGGGCCTGCA GGTGACTCCC TGCGCGAGAT CGTCACCACC 
ATCCGCGGCT TTTCCGTCTC TGAACTCGAC GTGCGCCGCA AACCAACCTT CTGGGAACGT 
CTTCTGGGGC GCGCGGCCCC CTTTGCCAAG TTCACCGCCC GTTATGAAAG CGTGCAGGGG 
CAAATCGACA AGATCACCGA TAGCCTTCTG GCGCATGAGC ATACGCTCCT GAAGGACATC 
AAGTCCCTCG ACGTTCTCTA TGAAAAGACG CTGAATTTCT ACGACGAGCT GGCGCTCTAT 
ATTGCGGCGG GCGAGGCAAA GCTGGCCGAG CTCGACAGCA CCGAAATCCC CGCGCTCGAG 
GCAGCTGTGG AAGCCGCGGC TGAGAACGAT CAGGTCATCA AGGCGCAGGA GCTGCGCGAC 
CTGCGCGCGG CCCGCGACGA TCTGGAACGC CGCGTGCACG ACCTGAAACT CACGCGTCAG 
GTGACGATGC AGTCCCTGCC CTCTATCCGA CTGGTGCAGG AAAACGACAA GTCTCTGGTC 
ACCAAGATCA ACTCCACGCT CGTCAATACC GTGCCGCTCT GGGAGACCCA GTTGGCGCAG 
GCTGTCACGA TCCAGCGGTC TGCCGAGGCC GCAAATGCGG TGCGCGATGC CAACAACCTC 
ACCAATGAAC TGCTGACCGC CAATGCCGCA AACCTGCGCG AGAGCAACAA GGTCATCCGC 
GAGGAAATGG AGCGTGGCGT CTTTGACATC GAAGCGGTCA AACAGGCCAA TGCCGACCTG 
ATCGGCACCA TCGAGGAAAG CCTGCAGATC GCCGATGAGG GCAAGCGCAA GCGGGCCGAG 
GCCGAGGCCG ATCTGAAGAA AATGGAAGCC GAGCTGCGCG ACACGCTGGC AGCTGCCAAA 
GCGCGCAAGG ATGGGGTCGG CGACACGGCG GCCACCTCGG TTCCAAAGTG A

Protein sequence

MSETIQQKAV EAETLVKEVT EVSLPDPKGE LATLEAADPE TTTAIRRRID EIDMGDTNSI 
ISFGSAAQGE LQQISQAMLT DVRNKDVGPA GDSLREIVTT IRGFSVSELD VRRKPTFWER 
LLGRAAPFAK FTARYESVQG QIDKITDSLL AHEHTLLKDI KSLDVLYEKT LNFYDELALY 
IAAGEAKLAE LDSTEIPALE AAVEAAAEND QVIKAQELRD LRAARDDLER RVHDLKLTRQ 
VTMQSLPSIR LVQENDKSLV TKINSTLVNT VPLWETQLAQ AVTIQRSAEA ANAVRDANNL 
TNELLTANAA NLRESNKVIR EEMERGVFDI EAVKQANADL IGTIEESLQI ADEGKRKRAE 
AEADLKKMEA ELRDTLAAAK ARKDGVGDTA ATSVPK