Gene Smed_3002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3002
Symbol
ID	5323879
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	3152611
End bp	3153867
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	63%
IMG OID	640791953
Product	hypothetical protein
Protein accession	YP_001328666
Protein GI	150398199
COG category	[S] Function unknown
COG ID	[COG2966] Uncharacterized conserved protein [COG3610] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.682044
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGCAGT CCGATAATAA AAGGCCCGAA CCCGGCGTGC CGGACGACTC GATCGACATG 
CTGCTGCGGT TTGCCGCTAT GATGTTTCGT TCCGGGGGCA CCGCCACCCG TACCCGCGAA 
CTTGTGGGGG CGATGGCGCA CCGCCTCAAC CTGGAAACGC CATCGGTGAG TCTCACGCTC 
GAATCCGTCA CCCTCAGTGT TTATCGCGGC AGCGAACAGT TCGTAGCGAT ACGCGAGATC 
GGTCCGCCCG GAATCGACTT CAGGCGCCTC GGTGAGTTGG AGCGGCTTGC GAACGCGCCA 
GAGGCAACGG CACCGCCACA CCGGATCGCG ACAGAACTTG CTGAAATCGA ATCGCGCGCG 
CCTCGATATT CCGGGTGGCA GATGGCGATC GCGATCGGCC TGGCCAGCGG AGGGTTTGCG 
TTCCTCAACG GAGCGGCCCT GCCGGAAATG GCCACCGCCG CGATCGGTGG CGGCACAGGT 
CAAGGATTGC GTTGGTGGTT GACCCGCCGC CAATTGACCG ACTTCGGCAC GGCGGCATTG 
GCTGCTGTAA CCGCTGCCGG AACTTACGTT CTGGTGGCGG CGCTGGCGCA CCGTGCAGGG 
ATTGCGTTCT CGCACTATGC CGCGGGCTTC ATCTCCACCA TACTATTTCT CATCCCGGGC 
GTTTCGCTGA TTGCAGGATT GTTCGACCTG TTGCAGCATC AGACGGTGGC TGCCTTAAGC 
CGGCTGGCAC ATGGCGCGTT GATCCTGTTC ATCGTCGCTT CGGGGCTGAG CATCGTGATG 
ACTGTTGCGA GCATCGAGCT GTTGCCGCGC TCTGCGCCGG CCGAGCTTGC CTATCCGTTG 
CGCCTTTCGC TTCGCGCCGT CGCGAGCTTC GTCGCTGGCT GCGGCTTCGC CATGCTGTTC 
AACAGCGCGC CATTTTTGGT GGTCGTCGCG GGCATCGTGG CGCTGGCGGC GAATAGCGTG 
CGCCTCGTCC TGATCGACAT GGGAATGCTG CTGGCGCCGG CGGCGTTCAT CGCCGCGTTT 
TCGATAGGAA TCATCGCCGT TCTTGCGAGC CGGCGGTTGG ACGCAGAGCT CATGGCCATT 
GTTACCCCGC CAGTCGTCAT CATGATTCCG GGTCTCTACG CATTCGAGAT GCTTGTTCTG 
TTCAACCGGG GGCAGATGCT CGAGGCCATG CAGGCCTCGG GGGCAGGCAT CTTCGTGATC 
AGCGCGCTGG CGATGGGGTT GAGCGTGGCG CGCCTTGCAG TCCCGTGGGA ACGATAG

Protein sequence

MTQSDNKRPE PGVPDDSIDM LLRFAAMMFR SGGTATRTRE LVGAMAHRLN LETPSVSLTL 
ESVTLSVYRG SEQFVAIREI GPPGIDFRRL GELERLANAP EATAPPHRIA TELAEIESRA 
PRYSGWQMAI AIGLASGGFA FLNGAALPEM ATAAIGGGTG QGLRWWLTRR QLTDFGTAAL 
AAVTAAGTYV LVAALAHRAG IAFSHYAAGF ISTILFLIPG VSLIAGLFDL LQHQTVAALS 
RLAHGALILF IVASGLSIVM TVASIELLPR SAPAELAYPL RLSLRAVASF VAGCGFAMLF 
NSAPFLVVVA GIVALAANSV RLVLIDMGML LAPAAFIAAF SIGIIAVLAS RRLDAELMAI 
VTPPVVIMIP GLYAFEMLVL FNRGQMLEAM QASGAGIFVI SALAMGLSVA RLAVPWER