Gene TM1040_1227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1227
Symbol
ID	4075935
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	1320632
End bp	1321807
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	61%
IMG OID	638006535
Product	Fmu (Sun)
Protein accession	YP_613222
Protein GI	99081068
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACCGG GTGCGCGCGT ACAGGCGGCT ATTGAAATTC TCGATGAAAT CCTCGCGGGT 
CAGGCTGTGG AAAAGACCCT GACCAACTGG GCGCGGCGCA GTCGATTTGC CGGATCAAAA 
GACCGCGCCG CGGTGCGCGA TCACGTCTAT CAGGCGCTTC GGTGCCGCCG GTCCTATGCG 
GTTCTGGGGG GAAGTGAGAC CGGACGGGGG CTGATGCTTG GCGCTTGCAA GGATCAAGGG 
CTTGATCAGG CAGTGCTCTT TCACGGTGAA GGGCATGCGC CGTCCCCCCT CAGCGCCGCC 
GAACAGAGCA TCGCGCCCGA ATTTCACAGC GACGCAGAGC GTCATGATAT CCCGGAGTGG 
CTCTGGCCCG TGTTTTCACG CAGCCTCGGC ACTGAGGCGA TTGCAGCGGC AACCGCGCTC 
AGGTCTCGAG CGGCAGTTCA TCTGCGGGTG AACCTCTTGA AAGGAGATCG CGACAACGCC 
ATCAAGCGGC TCACGCGGGA GGGCATTGCC ACAGAGCCGC ATCCAGCCTC GCCGACCGCC 
CTGACCGTGA CAGAGGGGGC GCGCCGCATA AAAAACGCAG AAAGCTACCT GCAAGGCTTT 
GTGGAATTGC AGGACGCTGC CAGTCAGGCA GTCGTCGATA AGCTGCCAGT GCAAAATGCC 
CCGAGGATAT TGGACTATTG TTCCGGCGGT GGAGGCAAGG CTCTGGCGAT TGCAGCACAG 
ACCCAGGCTG AGGTCTATGC GCATGATGCA GACCCACGAC GCATGCGCGA CATTCCCGAA 
CGCGCCATGC GGGCGGGGGC GGATATTCGC TGCCTTACCT CCGAGGAGCT TGTAACGCAG 
GCGCCGTTTG ACCTCGTGCT CTGTGATGCG CCCTGCAGTG GTAGCGGGTC TTGGAGGCGT 
GATCCCGAGG GTAAGTGGCG CCTCACGCAG GACACTCTTG ATGACACCGT AGCGCTGCAG 
GCCCGAATTC TGGATGAAGC TGCTCAACGC GTCGCGCCGG GGGGCGTCCT GGCCTTTGCG 
ACCTGTTCGA TGCTGGATGT GGAAAACAGC CTGCAGACAC AGCGCTTTCA GGAGCGGCAC 
ACCGGCTGGG CGCACTTGTC TGAAACGGCA TGGCATGTGC ATAGTGGAAC AGACGGATTT 
TACGTATCGG TGTTTCGGCG GAATGGCACA GAATAA

Protein sequence

MTPGARVQAA IEILDEILAG QAVEKTLTNW ARRSRFAGSK DRAAVRDHVY QALRCRRSYA 
VLGGSETGRG LMLGACKDQG LDQAVLFHGE GHAPSPLSAA EQSIAPEFHS DAERHDIPEW 
LWPVFSRSLG TEAIAAATAL RSRAAVHLRV NLLKGDRDNA IKRLTREGIA TEPHPASPTA 
LTVTEGARRI KNAESYLQGF VELQDAASQA VVDKLPVQNA PRILDYCSGG GGKALAIAAQ 
TQAEVYAHDA DPRRMRDIPE RAMRAGADIR CLTSEELVTQ APFDLVLCDA PCSGSGSWRR 
DPEGKWRLTQ DTLDDTVALQ ARILDEAAQR VAPGGVLAFA TCSMLDVENS LQTQRFQERH 
TGWAHLSETA WHVHSGTDGF YVSVFRRNGT E