Gene TM1040_1818 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1818
Symbol
ID	4076964
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1912042
End bp	1913139
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	61%
IMG OID	638007133
Product	hypothetical protein
Protein accession	YP_613813
Protein GI	99081659
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0390612
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.325282
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCCGA AAGATGCCGA GGAAACCCAC CGTTTTCCGT GCGAGCAATG TGGCGCGGAC 
TATCGTTTTG CCCCGGCGGA GGGCGGGCTT GTCTGTGATC ATTGCGGCCA CAAGAAAGAG 
CTGATCGAAA GCCCATGGGG CGGTGGGGCG CTGAAGGAAC TCGACTTCCT GCAAGCGCTG 
CGTGAACAGC TTCCCGCTGC CGAAATGGAA GTCACGCGCG TCTCCTCCTG CCCCAACTGC 
GCCGCCCAGG TCGAATTCGA CCCGGCGGTG CATGCGCTGG AATGTCCCTT CTGCGCGACC 
CCCGTGGTGG CCGACACCGG CGAGAATCGC CACATCAAAC CCAAGGGCGT GCTGCCCTTT 
CAGTTTGACG AACGCGCCGC ACATCAGGCG ATGGAAGACT GGCTCGGCAA GCTGTGGTTC 
GCGCCCAACG GGCTAAAGGA ATACGCCCGC AAAGGGCGCA AGATGGATGG GATCTATGTC 
CCCTACTGGA CCTATGACGC CCAGACCCAC AGCCAATACA CCGGCCAGCG CGGCACCGAA 
TATACCGTAA GCCGTACCGT CATGGTGGAT GGCAAACCCC AGGTGCGCAG CGAAATCCGC 
GTGCGCTGGT CCAATGTGCG TGGACGGGTG CAGCGATTCT TTGACGATGT GCTGGTGCTC 
GCCTCCAAAA GCCTGCCGCG CAAATACACC GAAGGCCTCG AGCCCTGGGA CCTGTCGCAG 
CTTGCGCCTT ATCAGCCCAA GTATCTCGCA GGGTTTCGCG CGGAGGCCTA TACCATCGAC 
CTTGAAGCCG GCTTTGCCGA TGCGCGGCAA AAAATGGACC GCATCATCGA GCGTGACATC 
AAATTCGACA TTGGCGGCGA CCGCCAGCGG ATCAGTTCGG TCGATACGGA CGTCAGCGCG 
GTCACATTCA AACATGTGCT GCTGCCGGTG TGGATGGCCG CTTATAAATA TCGCGGGCAG 
AGCTATCGCT TTGTGGTCAA CGGGCAGTCG GGGCGCGTGC AGGGCGAACG CCCCTTTTCC 
GCCTGGAAGA TCGCAGGCGC GGTTGTCGTC GGCCTGATCC TGGCGGCAGG CGTGGCCTAC 
CTGGCGTCAC AGAGTTAA

Protein sequence

MTPKDAEETH RFPCEQCGAD YRFAPAEGGL VCDHCGHKKE LIESPWGGGA LKELDFLQAL 
REQLPAAEME VTRVSSCPNC AAQVEFDPAV HALECPFCAT PVVADTGENR HIKPKGVLPF 
QFDERAAHQA MEDWLGKLWF APNGLKEYAR KGRKMDGIYV PYWTYDAQTH SQYTGQRGTE 
YTVSRTVMVD GKPQVRSEIR VRWSNVRGRV QRFFDDVLVL ASKSLPRKYT EGLEPWDLSQ 
LAPYQPKYLA GFRAEAYTID LEAGFADARQ KMDRIIERDI KFDIGGDRQR ISSVDTDVSA 
VTFKHVLLPV WMAAYKYRGQ SYRFVVNGQS GRVQGERPFS AWKIAGAVVV GLILAAGVAY 
LASQS