Gene Smed_1760 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1760
Symbol
ID	5322618
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	1842139
End bp	1843203
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	61%
IMG OID	640790698
Product	cobalamin biosynthesis protein CobW
Protein accession	YP_001327430
Protein GI	150396963
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID	[TIGR02475] cobalamin biosynthesis protein CobW

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0805096
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.0884735
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACTCG CGAAGTCTCA GCAGGGCAAG ATTCCCGCTA CCGTCATCAC CGGGTTTCTC 
GGTGCCGGCA AGACGACGAT GATCCGCAAT CTGCTGCAGA ATGCCGACGG CAAGCGCATC 
GCGCTGATCA TCAACGAGTT CGGCGACCTA GGCGTCGACG GCGACGTGTT GAAGGGTTGC 
GGAGCTGAAG CCTGCACGGA GGATGATATC ATCGAGCTGA CCAATGGCTG CATTTGCTGC 
ACTGTTGCCG ACGACTTCAT TCCGACCATG ACGAAGCTGC TCGAAAGAGA GAACCGTCCG 
GACCATATCA TCATCGAGAC CTCGGGCCTG GCGCTGCCGC AGCCGCTCGT CGCGGCATTC 
AACTGGCCGG ACATCCGCAG CGAGGTAACG GTCGACGGCG TCGTTACCGT CGTCGATAGC 
GCCGCCGTTG CCGCGGGCCG CTTCGCAGAC GATCATGACA AGGTGGACGC ACTCCGCGCA 
GGCGATGAAA ATCTCGATCA TGAGAGCCCG CTCGAAGAAC TCTTCGAGGA CCAGCTCACA 
GCTGCCGACC TCATCGTTCT CAACAAGACG GATCTCATCG ATGCCGCGGG GTTGAAGTCG 
GTGCGCGATG AAGTGGCCTC ACGCATCAAC CGCAAGCCCA CCATGATCGA GGCGAAGAAC 
GGTGAGGTAG CAGCTGCCAT CCTGCTCGGG CTCGGGGTGG GTACGGAGGG CGACATCGTC 
AACCGCAAGT CTCACCACGA GATGGAGCAC GAGGCGGGCG AGGAGCATGA TCACGACGAA 
TTCGACAGCT TCGTCGTCGA ACTGGGTGCC ATAGCCGATC CTGCCGTTTT CGTGGAACGG 
CTCAGAAATG TGATCGCACA GCACGACGTG CTGCGCCTCA AGGGTTTCGT CGACGTTCCC 
GGCAAATCGA TGCGCCTCCT GATACAGGCG GTGGGCAGCC GCATCGACCA GTATTTCGAT 
CGCGCATGGG CTCCGGGCGA AACGCGCAGC ACACGGCTGG TCGTCATAGG CCTGCATGAC 
ATGGATGAGC CTGCCCTGCG GGCGGCAATA TCGGCACTTG TGTAA

Protein sequence

MTLAKSQQGK IPATVITGFL GAGKTTMIRN LLQNADGKRI ALIINEFGDL GVDGDVLKGC 
GAEACTEDDI IELTNGCICC TVADDFIPTM TKLLERENRP DHIIIETSGL ALPQPLVAAF 
NWPDIRSEVT VDGVVTVVDS AAVAAGRFAD DHDKVDALRA GDENLDHESP LEELFEDQLT 
AADLIVLNKT DLIDAAGLKS VRDEVASRIN RKPTMIEAKN GEVAAAILLG LGVGTEGDIV 
NRKSHHEMEH EAGEEHDHDE FDSFVVELGA IADPAVFVER LRNVIAQHDV LRLKGFVDVP 
GKSMRLLIQA VGSRIDQYFD RAWAPGETRS TRLVVIGLHD MDEPALRAAI SALV