Gene TM1040_2059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2059
Symbol
ID	4077986
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2162703
End bp	2163857
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	58%
IMG OID	638007378
Product	Rieske (2Fe-2S) region
Protein accession	YP_614053
Protein GI	99081899
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGC CAGTCTCACT TCAGTCTGTC CTCACGTCGG TCAATCGCGC CAACGGGCTG 
CCCAATGCGC ATTACATCGA CCCGGTGGTC TTTGCCGAGG AGCGCGCTGC AGTGCTGTTT 
GCCAATTGGT CCGGCGTGGG TTTTGGCAAG GACATCCCCA ACCCCGGCGA TGCAAAGCCC 
GTGGATTTCC TCGGTGTGCC GCTGTTGCTG GTGCGCGATC ACGATGGCGG TGTCCATGTC 
TATCAAAACA CCTGCCGGCA CCGGGGCATG ATCCTTGTGG AAGAAGCCAA GAACATCCGT 
GGCACCATCC GCTGCCCCTA TCACAGCTGG TGCTACAGCC TGAAAGGCAA GCTGCGCGCT 
GCACCCCATG TGGGCGGGGT TGGCCAGAAC ACCCATGCCG ACGTAAAGAT GGACGAATTG 
AGCCTCGTCT CTTTTCGCGC TCATGTCTGG CAGGACGTGA TCTTTGTGAA TATCGACGGC 
AAGGCCGCGC CCTTTGAGGA GGTGCATGCG GACCTTCTGC AACGCTGGCA GGAATTCGAC 
CGCCCCTTGC ACCACGGCGG ACCGGAAAGC TCGCTGAAGT TGGAAGTCAA AACCAACTGG 
AAGCTCGCGG TGGAAAACTA CTGCGAGAGC TATCATCTGC CTTGGGTGCA TCCTGGTCTC 
AACAGCTACT CGCGACTAGA AGATCACTAC AATATTGAAA AACAAGGAAA ATACTCCGGC 
CAAGGAACGT TGGTCTATCG CCAGCTGCGC GGGGCCGAGG ATGAAGTCTT TCCCGATTTC 
GAAGGGCTCA GCGACAAATG GGAGACCGGC GGAGAATATG TCGCGCTCTA TCCCAACGTC 
CTCTTGGGGG TTCAGCGCGA CCATAGTTTC GCAATCGTCC TGGAGCCCAA GGGATGCGAG 
GAAACGGTCG AGCACATCGA GCTCTACTAC GCAAAATCAA GCGCCGAGAC ACCCGAGCTG 
GACCCGTTGC GCCATCAGAA TGCGCAGCTC TGGAAGACCG TTTTTGAAGA AGACGTCTTT 
GTGGTCGAGG GCATGCAGAA GGGGCGGCAT GGGCCGATGT TCGACGGCGG GCGTTTCTCC 
CCCGCGATGG ACGGGCCAAC GCATAATTTT CACCATTGGG TTGCCACCCA GATCGAGGCT 
GCGCGCGCCT CATGA

Protein sequence

MTKPVSLQSV LTSVNRANGL PNAHYIDPVV FAEERAAVLF ANWSGVGFGK DIPNPGDAKP 
VDFLGVPLLL VRDHDGGVHV YQNTCRHRGM ILVEEAKNIR GTIRCPYHSW CYSLKGKLRA 
APHVGGVGQN THADVKMDEL SLVSFRAHVW QDVIFVNIDG KAAPFEEVHA DLLQRWQEFD 
RPLHHGGPES SLKLEVKTNW KLAVENYCES YHLPWVHPGL NSYSRLEDHY NIEKQGKYSG 
QGTLVYRQLR GAEDEVFPDF EGLSDKWETG GEYVALYPNV LLGVQRDHSF AIVLEPKGCE 
ETVEHIELYY AKSSAETPEL DPLRHQNAQL WKTVFEEDVF VVEGMQKGRH GPMFDGGRFS 
PAMDGPTHNF HHWVATQIEA ARAS