Gene Rsph17029_1467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1467
Symbol
ID	4896622
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1528940
End bp	1529977
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	72%
IMG OID	640112056
Product	cobalamin biosynthesis protein CobW
Protein accession	YP_001043349
Protein GI	126462235
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID	[TIGR02475] cobalamin biosynthesis protein CobW

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0356377
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACC TCGCGAAGAT CCCCGTCACG GTGATCACGG GCTTCCTCGG CGCCGGCAAG 
ACCACGCTGA TCCGGCACCT GATGCAGAAC CCCGGCGGCC GCCGCCTCGC CGTGCTGGTG 
AACGAGTTCG GCACGGTGGG CGTGGACGGC GATCTGATCC GCGCCTGCGC CGACGAGAAC 
TGCCCCGACG AGGCCATCGT CGAGCTGGCG AACGGCTGCC TCTGCTGCAC CGTGGCCGAC 
GAGTTCATCC CCACGATCGA GGCGCTGATG GCGCTGCCGA AGCGCCCCGA CCACATCCTG 
ATCGAGACCT CGGGCCTCGC GCTGCCGAAG CCGCTCCTGA AGGCCTTCGA CTGGCCCGCG 
ATCCGCTCGC GCATCACGGT GGACGGGGTG ATCGCGCTGG CCGATGCCGA GGCCGTGGCC 
GCGGGCCGCT TCGCCCCGGA TGCCGAGGCG GTGGCGGCGC AGGCTCAGGC CGAGGGCGCC 
GATCACGAGA CCCCGCTCTC GGAAGTGTTC GAGGATCAGT TGGCCTGCGC CGACCTCGTG 
CTGCTGACCA AGGCCGATCT CGCGGGCGAG GCGGGCCTTG CCGCCGCCCG CGCGGCGGTC 
GAGGCGGAAT CGCCGCGGCC GATCCCGATC CTCGCCGTGA CCGAGGGCGC GGTCGATCCG 
CAGGTCATCC TCGGGATCGA GGCCGCGGCC GAGGACGATC TGGCCGCCCG CCCGTCGCAC 
CACGACGGGG CCGACGATCA CGAGCATGAC GATTTCGCCT CGACCGTGAT CGACCTCCCC 
GAGATCGCCG ATCCCGAGCG TCTGGCCGAG GCGATCCGGG CACTCGCCAC CGAGCGCAAC 
GTGCTGCGGG TGAAGGGCCA TGTGGCGGTT CAGGGCAAGC CCATGCGGCT TCTCGTGCAG 
GCGGTGGGCG CGCGCGTCCG CCACCAGTTC GACCGGCCCT GGTCGGGCGC GCGGCAGAGC 
CGTCTCGTGG TGATCGCCGA GCGGGGCGAT CTCGACGAGG CCGCGATTTG GCAGGACCTT 
CTGGCGCGGA TCGGCTGA

Protein sequence

MTDLAKIPVT VITGFLGAGK TTLIRHLMQN PGGRRLAVLV NEFGTVGVDG DLIRACADEN 
CPDEAIVELA NGCLCCTVAD EFIPTIEALM ALPKRPDHIL IETSGLALPK PLLKAFDWPA 
IRSRITVDGV IALADAEAVA AGRFAPDAEA VAAQAQAEGA DHETPLSEVF EDQLACADLV 
LLTKADLAGE AGLAAARAAV EAESPRPIPI LAVTEGAVDP QVILGIEAAA EDDLAARPSH 
HDGADDHEHD DFASTVIDLP EIADPERLAE AIRALATERN VLRVKGHVAV QGKPMRLLVQ 
AVGARVRHQF DRPWSGARQS RLVVIAERGD LDEAAIWQDL LARIG