Gene TM1040_1989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_1989
Symbol
ID	4077173
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	2092984
End bp	2094432
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	65%
IMG OID	638007304
Product	cobyric acid synthase
Protein accession	YP_613983
Protein GI	99081829
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1492] Cobyric acid synthase
TIGRFAM ID	[TIGR00313] cobyric acid synthase CobQ

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.56437
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCAAG GCACCGGCAG CAATGTCGGA AAATCCATGC TGGTGGCAGG GCTAGCACGG 
GCCTTGCGCA AACGCGGCCT CTCGGTGGCG CCCTTCAAAC CGCAGAACAT GTCCAACAAC 
GCCGCCGTCA CCTCGGACGG GGGGGAGATC GGCCGCGCCC AGGCCCTGCA GGCCCGCGCG 
GCGGGGCTTG CGCCGCATAC GGATATGAAC CCGGTGCTCC TGAAGCCCGA AACCGATACC 
GGCGCGCAGG TCATCGTGCA GGGCAAGCGG CGCGGCACCC GCGCGGCGGG GTCGTTTATG 
CGCGACAAGG CGGGCCTTCT GGAAGCCACG CTCGAGAGCT TTCACCGCCT CGCAGCGCAG 
CATGACATTG TCCTCATCGA GGGCGCAGGC TCTCCGGCAG AAACCAATCT GCGCAAGGGC 
GACATCGCCA ATATGGGCTT TGCCGAAGCT GCAGGCGTAC CTGTCTTGCT GGTGGGCGAC 
ATCCATCGGG GCGGGGTGAT CGCGCAGATC GTTGGCACCC ATACGGTGTT GGAGCCAAGC 
GACCGCGCGC GGATCAAAGC CTTCGCCGTC AATCGCTTCC GGGGCGACCT TAGCCTTTTT 
GATGGCGGGC GGGATGACAT TGCGCGCTGG ACGGGCTGGC CTTCGCTGGG GGTGGTGCCA 
TGGTTCTGGG ATGCGTGGAA ACTGCCGGCC GAGGATATGA TGGACATCGC CTCCCACAAG 
GGCGGCGCTT GCAAGGTGGT GGTGCCGCAG CTTGAACGCA TGGCGAATTT CGACGACCTC 
GACCCGCTTG CAGCAGAACC TGCGGTGACG GTCGAGATCG TGCCCCCCGG GCGCGCCCTG 
CCCGGTGATG CGGATCTGGT GCTGATCCCC GGCTCCAAAT CCACTATCGG CGATCTGGCC 
TATCTGCGCA CGCAGGGCTG GGACATCGAC ATCCTCGCTC ATCACCGGCG CGGCGGACAT 
GTGCTCGGGC TTTGTGGCGG CTATCAGATG CTCGGCCAGA GTATCGACGA TCCCGAAGGT 
GTCGATGGCC ATCCCGGCAA AGTCGCGGGG CTTGGCCTCT TGGATGTCCA CACTGTTATG 
GCCGGAGACA AGCGCGTCAC CCTGAGCGCG GCGCGCACAC TCGAGGGGGA TCTGCCTGTT 
TCTGGCTATG AGATCCACAT GGGCCGCACC ACGGGGCCGG ATTGCGCGCG GGCCTGGCTC 
GCGCTCGAAG GCCGCGCGGA GGGGGCGACC TCTGCCGATG GGCGTGTGCG CGGCTCTTAT 
CTGCACGGGC TTTTTACATC GGACGCGTTT CGGGCACAGT TCCTCTCCGA CCTCGGACAC 
CAGTCCGATC TGGACTATGA CGCCGGGGTC GAGGCGACGC TTGATGAGCT TGCAGCCCAT 
CTTGAACAAT ATATGGATGT GGAAGGCCTG CTCGAACTGG CCGAACCCAT TCCTGTGCCT 
GAATCCTGA

Protein sequence

MIQGTGSNVG KSMLVAGLAR ALRKRGLSVA PFKPQNMSNN AAVTSDGGEI GRAQALQARA 
AGLAPHTDMN PVLLKPETDT GAQVIVQGKR RGTRAAGSFM RDKAGLLEAT LESFHRLAAQ 
HDIVLIEGAG SPAETNLRKG DIANMGFAEA AGVPVLLVGD IHRGGVIAQI VGTHTVLEPS 
DRARIKAFAV NRFRGDLSLF DGGRDDIARW TGWPSLGVVP WFWDAWKLPA EDMMDIASHK 
GGACKVVVPQ LERMANFDDL DPLAAEPAVT VEIVPPGRAL PGDADLVLIP GSKSTIGDLA 
YLRTQGWDID ILAHHRRGGH VLGLCGGYQM LGQSIDDPEG VDGHPGKVAG LGLLDVHTVM 
AGDKRVTLSA ARTLEGDLPV SGYEIHMGRT TGPDCARAWL ALEGRAEGAT SADGRVRGSY 
LHGLFTSDAF RAQFLSDLGH QSDLDYDAGV EATLDELAAH LEQYMDVEGL LELAEPIPVP 
ES