Gene TM1040_1548 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1548
Symbol
ID	4075846
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	1654635
End bp	1656215
Gene Length	1581 bp
Protein Length	526 aa
Translation table	11
GC content	60%
IMG OID	638006861
Product	5'-nucleotidase-like
Protein accession	YP_613543
Protein GI	99081389
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0737] 5'-nucleotidase/2',3'-cyclic phosphodiesterase and related esterases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00999704
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.364034
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTTCAC GTTTTCTGAC GTCGGCAGCG GCGCTGGGGC TTACGGCTGG CATGGCCGCG 
GCCGAGTACA AGCTGACGAT CTTGCACACC AACGACATCC ACAGCCGCAT CGAGTCGATC 
AGCAAATATG ATTCCACTTG CGGCGCCGAT GACGAGGCCG AGGGCAAGTG TTTTGGCGGC 
ATCGCCCGCG TCAAGACCAT GGTCGACACC AAACGTGCCG AGCTCGACGG CCAGAACGTG 
CTTCTGCTGG ACGCGGGCGA CCCGTTCCAG GGCTCGCTGT TTTACACCAC CTACAAGGGG 
GCAGCCGAAG CCGAGTTCAT GGAAGACATC GGCTATGACG TAATGGCGGT GGGCAACCAC 
GAATTTGACG ACGGACCGGC CGGTCTGCAG CAATTTGTCG ACACTGTGTC TTTCCCGGTG 
ATTTCCGGCA ACCTCGATCT GAGCTCCGAG CCGCTCCTGA AAGGCAAGGT GGGCAACCAT 
GTCGTGCTTG AAGTGGGCGG CGAGAAAATC GGCATCATCT CCGCGCTGGC GACAGACACG 
GTCGAGACCT CCTCGCCGGG GCCGAATGTG GTGTTTCAGG ATGAGATCGA CAGCCTGATC 
GCCGACGTTG AGGCCCTGCA GGCAGAAGGC GTCAACAAGA TCATCGCGCT GACCCATGTG 
GGTCTGGCCA AGGATATGGA AATCGCCGCC AAAGTGCCGG GGGTGGATCT CGTCGTGGGT 
GGTCATTCGC ACACGCTTTT GTCCAACACC TCTGATCGTG CCGCGGGCGC ATATCCGACC 
ATGGTGGGCG ATGTGCCAGT GGTGCAGGCC TATGCCTATA CCAAGTACCT GGGCGAGCTC 
ACTGTGACCT TTGATGACGA AGGCAATGTC ATCTCCGCTG CGGGCGAGCC GATCCTGCTT 
GATGCCTCTG TGACGCCGGA TGCCGACATG GTCGCGCGCA TCAAGGAGAT GGGTGCTCCC 
ATCGATGAGA TGAAAACCCG CGTGGTTGCC GAGACAACCG ATGCGGTCGA AGGCTCGCGT 
GATGTCTGCC GCGCTGGCGA ATGTGCCATG GGCAACCTCG TCGCGGATGC CATGCTGGCC 
CGCGTCAAGG ATCAGGGTGT GAGCATTGCG ATCCAGAACG GTGGCGGTCT GCGCGCATCG 
ATCGATGCGG GCGAAGTCAC CATGGGTGAA GTGCTGAGCG TCCTGCCGTT CCAGAACACG 
CTCTCCACCT TTGAGGTCTC CGGCCAGACG ATGATTGAGG CCTTGGAAAA CGGCGTTGGG 
CAGATCGAGG ACGGCGCAGG CCGCTTCCCG CAGGTTGCAG GGCTGAAATA TGCGTTTGAC 
GCCTCCAAGG AGCCGGGCGC GCGCATTTCC GACGTGATGG TCATGGAAGG CGAGACCTGG 
GTTGCGATTG ATCCGGCCAA AACCTACGGC GTTGTGTCCA ACAACTACGT GCGCAATGGC 
GGCGACGGCT ACAAGATGTT CGCAGGCGAC GACAAGAACG CTTATGACTT TGGCCCCGAC 
CTTGCGGATG TTGTTGCCGA ATACCTCGCC GAGGTCGGCC CCTACAGCGC CTATACCGAC 
GGCCGCATCA CCAAGAAGTA A

Protein sequence

MISRFLTSAA ALGLTAGMAA AEYKLTILHT NDIHSRIESI SKYDSTCGAD DEAEGKCFGG 
IARVKTMVDT KRAELDGQNV LLLDAGDPFQ GSLFYTTYKG AAEAEFMEDI GYDVMAVGNH 
EFDDGPAGLQ QFVDTVSFPV ISGNLDLSSE PLLKGKVGNH VVLEVGGEKI GIISALATDT 
VETSSPGPNV VFQDEIDSLI ADVEALQAEG VNKIIALTHV GLAKDMEIAA KVPGVDLVVG 
GHSHTLLSNT SDRAAGAYPT MVGDVPVVQA YAYTKYLGEL TVTFDDEGNV ISAAGEPILL 
DASVTPDADM VARIKEMGAP IDEMKTRVVA ETTDAVEGSR DVCRAGECAM GNLVADAMLA 
RVKDQGVSIA IQNGGGLRAS IDAGEVTMGE VLSVLPFQNT LSTFEVSGQT MIEALENGVG 
QIEDGAGRFP QVAGLKYAFD ASKEPGARIS DVMVMEGETW VAIDPAKTYG VVSNNYVRNG 
GDGYKMFAGD DKNAYDFGPD LADVVAEYLA EVGPYSAYTD GRITKK