Gene TM1040_2209 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_2209
Symbol
ID	4078200
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2319801
End bp	2320835
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	61%
IMG OID	638007531
Product	cobalamin (vitamin B12) biosynthesis CobW
Protein accession	YP_614203
Protein GI	99082049
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID	[TIGR02475] cobalamin biosynthesis protein CobW

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.859835
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCAT TGAACAAGAT CCCCGTCACC GTCATCACCG GCTTTCTGGG CGCGGGCAAA 
ACCACATTGA TCCGTCACCT GATGCAGAAC CCGCAGGGCA AGCGCCTCGC TGTGGTGGTG 
AACGAATTTG GCACCGCCGG TGTGGATGGC GACATCCTGA AATCCTGCGC GGATGACAAC 
TGCCCCGCAG AGAACATCAT GGAGCTCGCA AACGGCTGCA TCTGCTGCAC CGTGGCGGAT 
GATTTCATCC CCACCATCGA GAGCCTGATG GCGCTGCCCG AACCGCCCGA ACACATCGTT 
ATCGAGACCT CTGGCCTGGC GCTGCCCAAA CCGCTGCTCA AGGCCTTTGA TTGGCCCGCG 
ATCCGCTCGC GCATCACCGT TGACGGTGTG ATCGCTCTGG CTGATGCCGA GGCCGTCGCC 
AAGGGCCAGT TTGCCCCAGA TCTGGACGCC GTGCAGGCCC AGCGCGAGGC AGACGAGAGC 
CTCGATCACG AAACCCCGCT CTCCGAAGTC TTTGAAGATC AGATCGCCTG CGCCGATATC 
GTACTGTTGT CCAAGGCCGA TCTCGCCGGT GAGGCCGGTG TCGACAAAGC CCGCGCGATC 
ATCGAATCTG AGGCCCCGCG CAAACTGCCG ATCCTGCCGA TGACCGAAGG CGTGATCGAT 
CCTCGCGTGA TCCTCGGACT GGAAGCTGCG GCCGAAGACG ACCTTGATGC CCGCCCGAGC 
CATCACGACG GACATCACGA TCACGAACAT GACGATTTTG AATCGATCGT GGTCGAAATG 
GGCGAAGTAT CCGACCCCGA AGACCTGCAA AAACGGATCA TCGAGATGGC CCGCAGCCGC 
AACATCCTGC GGGTGAAGGG CTATGTGGCC GTGGAAGGAA AACCGATGCG AATGCTGGTA 
CAAGCGGTGG GCGAACGTCT GCGCGCGCAA TACGACCAAC CCTGGGGCGC ACAGGAGCGT 
AAAACCCAGC TGGTGGTGAT CGCCGAGCAT GATAACGTCG ACACAGCAGG CATCCACGCC 
GATCTCGGGG CCTGA

Protein sequence

MTSLNKIPVT VITGFLGAGK TTLIRHLMQN PQGKRLAVVV NEFGTAGVDG DILKSCADDN 
CPAENIMELA NGCICCTVAD DFIPTIESLM ALPEPPEHIV IETSGLALPK PLLKAFDWPA 
IRSRITVDGV IALADAEAVA KGQFAPDLDA VQAQREADES LDHETPLSEV FEDQIACADI 
VLLSKADLAG EAGVDKARAI IESEAPRKLP ILPMTEGVID PRVILGLEAA AEDDLDARPS 
HHDGHHDHEH DDFESIVVEM GEVSDPEDLQ KRIIEMARSR NILRVKGYVA VEGKPMRMLV 
QAVGERLRAQ YDQPWGAQER KTQLVVIAEH DNVDTAGIHA DLGA