Gene TM1040_0080 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0080
Symbol
ID	4075977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	-
Start bp	83627
End bp	84841
Gene Length	1215 bp
Protein Length	404 aa
Translation table	11
GC content	62%
IMG OID	638005367
Product	cobalamin synthesis protein, P47K
Protein accession	YP_612075
Protein GI	99079921
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGATC CCCGCCTTCC CGTCACCGTC CTCTCCGGCT TTCTCGGCGC GGGGAAGACC 
ACGCTTTTGA ACCGCATCCT GAACAACCGC GAAGGCCGGC GCGTTGCGGT GATTGTGAAC 
GATATGAGCG AGGTCAACAT CGACGCGGAT CTGGTGCGCG AGGGCGGCGC TGACCTCAGC 
CAGACCGAAG AAACGCTGGT GGAAATGTCC AACGGCTGCA TCTGCTGCAC CCTGCGCGAT 
GACCTTCTGG CCGAGGTGCG CCGTCTCGCC GCTGAGAACC GCTTTGACTA CTTGCTGATT 
GAGTCCACCG GGATCTCGGA GCCGCTGCCG GTCGCCGCAA CCTTTGATTT TCGCGATGCG 
GAGGGCGAGA GCCTCTCGGA TGTGGCGCGT CTGGACACGA TGGTCACGGT GGTCGACGCC 
GTGAACCTGC TGAACGATTT TGCCAGTCAC GACCTGCTGG CGGACCGGGG CGAGACGCTG 
GGCGAAGAAG ACGAGCGCAC CCTGGTGCAT CTGCTGACCG ACCAAATCGA ATTTGCCGAT 
GTGGTTGTGC TTAACAAGGT GAGCCTCGCC AGCGCCGAGC AAGTGGACGC GGCACGCAAG 
ATCATTCGCA GCCTCAACGC AGATGCCGAG ATCATCGAGA CCGATTTCAG CGAGGTGTCT 
GCCGACAAGA TCCTCGACAC CAAGCTCTTT GATTTTGAAA AGGCGCATGA ACACCCGATG 
TGGGCGAAGG AGCTTTATGG CTTTGCCGAT CATGTGCCGG AGACCGAAGA ATACGGCATC 
GCGTCCTTTG TCTATCGCGC ACGGGCGCCG TTTGATCCCA GCAAATTGCA CGTGGTGCTG 
AACGGCAATC TGCCCGGGGT AATCCGCGCC AAGGGGCATT TCTGGGTTGC GACCCGCCCC 
GAGTGGGTGG CGGAATTCTC GCTTGCGGGG GCGCTATCAA GCGTGGCGCC CTTGGGGACA 
TGGTGGGCAT CCGTTCCTGC CGAACGCTGG CCCACCCACC AGCAGGCGCG CGACTATATA 
CAGACGCATT GGCAGGAGCC CTTTGGCGAT CGCCGTCAGG AATTGGTTTT CATCGGCGCG 
GGCATCGACT GGCCCGCCCT GAAGGCCACG CTGGATGCCT GCCTGATCCC CGAAGCAACG 
GCCGAGACTC TGCAGGACTA TGCGGATCTG GACGATCCCT TCCCGCTGTG GCGGCGGGCC 
GATCAGGCAG CATGA

Protein sequence

MSDPRLPVTV LSGFLGAGKT TLLNRILNNR EGRRVAVIVN DMSEVNIDAD LVREGGADLS 
QTEETLVEMS NGCICCTLRD DLLAEVRRLA AENRFDYLLI ESTGISEPLP VAATFDFRDA 
EGESLSDVAR LDTMVTVVDA VNLLNDFASH DLLADRGETL GEEDERTLVH LLTDQIEFAD 
VVVLNKVSLA SAEQVDAARK IIRSLNADAE IIETDFSEVS ADKILDTKLF DFEKAHEHPM 
WAKELYGFAD HVPETEEYGI ASFVYRARAP FDPSKLHVVL NGNLPGVIRA KGHFWVATRP 
EWVAEFSLAG ALSSVAPLGT WWASVPAERW PTHQQARDYI QTHWQEPFGD RRQELVFIGA 
GIDWPALKAT LDACLIPEAT AETLQDYADL DDPFPLWRRA DQAA