Gene Smed_4002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4002
Symbol
ID	5319249
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	456248
End bp	457288
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	58%
IMG OID	640775810
Product	cobalamin synthesis protein P47K
Protein accession	YP_001312743
Protein GI	150376147
COG category	[R] General function prediction only
COG ID	[COG0523] Putative GTPases (G3E family)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.242709
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGACCA ACCATCTTCA GGACAGCAAA ATTCCCGTCA CCATCCTGAC CGGCTTTCTC 
GGTGCCGGGA AGACGACGCT TTTGAACCAC ATACTGACTG AACGGCACGG CCACCGCATC 
GCCGTGATCG AGAACGAGTT CGGCGAGGTG GATGTCGACT CGGACCTGGT GCTCGCCTCG 
GAGGAAGAGA TCTACCAGAT GAAGAACGGC TGCATCTGCT GCTTCGTCGA CGTGCGCAAC 
GACCTGATCG AGGTCCTGCA GAAACTGCTT GCCCGAAAGG ACAAGTTCGA CCACATCCTC 
GTCGAGACCA GCGGGCTGGC AGACCCGACC CCCGTTGCAA CAGCCTTCTT CATCGATGAT 
GAAATCGGCA AGCATGTGAC GCTGGACGGC ATCGTGACCC TGGTCGACGC CAAGCATATC 
GGACAGCATA TCGAGGATCC CGTTCTCGAT GGGCGCGACA ACCAGGCGGT CGATCAGATC 
GTCGCCGCCG ACCGTATCAT CATCAATAAG ATCGACCTCG TATCGGATGG CGAGATCGCT 
CCTCTGGAAC GCGACATGCG CAAGCTCAAC CAGACGGCCG AAATCGTACG CTCGAGCTAT 
GGCAAGGTGG ACCTGTCGAG CATCCTCGGC ATTTCCGGTT TCGCGCCATC CTATGTTGCC 
GAACGCGCCA AGCTGCTCGA TCTCGATCAC CACCACCACG GTCATCACCA CCACCATCAT 
CATGATGCGA CGGTCAGCTC GGAATCCTTC GTCTTCGACC GGCCCTTCGA CCAGCATCGC 
CTGACGGAAT ATCTCTCGGA CCTGCTTCGG GAAAAGGGCG ACGACATATT CCGTACCAAA 
GGCATCATAG CGATCACCGG AGACCCTCGC TTCTTCGTCC TCCAGGCGGT GCACAAGCTG 
ATGGATTTCC GTCCGGATCA TGTCTGGGGG AAGGATATGC CCTATTCGAA GCTGGTCTTC 
ATCGGCCGCA ATCTCGACCG GGCGGTCCTG GAGGAAGGTC TGAAGCGCTG CCTTACCCCG 
GCCGGCGAAA CGGTTTATTG A

Protein sequence

MQTNHLQDSK IPVTILTGFL GAGKTTLLNH ILTERHGHRI AVIENEFGEV DVDSDLVLAS 
EEEIYQMKNG CICCFVDVRN DLIEVLQKLL ARKDKFDHIL VETSGLADPT PVATAFFIDD 
EIGKHVTLDG IVTLVDAKHI GQHIEDPVLD GRDNQAVDQI VAADRIIINK IDLVSDGEIA 
PLERDMRKLN QTAEIVRSSY GKVDLSSILG ISGFAPSYVA ERAKLLDLDH HHHGHHHHHH 
HDATVSSESF VFDRPFDQHR LTEYLSDLLR EKGDDIFRTK GIIAITGDPR FFVLQAVHKL 
MDFRPDHVWG KDMPYSKLVF IGRNLDRAVL EEGLKRCLTP AGETVY