Gene Smed_2200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2200
Symbol
ID	5323060
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	-
Start bp	2281006
End bp	2282685
Gene Length	1680 bp
Protein Length	559 aa
Translation table	11
GC content	64%
IMG OID	640791138
Product	hypothetical protein
Protein accession	YP_001327868
Protein GI	150397401
COG category	[S] Function unknown
COG ID	[COG4425] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0720421
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACATG TTCAGCAGAC GGACCTGCCA AGACCGGTGC CCCGTCGCAT CTCCAACTTC 
TTGCGTTCGT TTTCCACAAG CGGCCTCCTC ATAGGCGTTC TCTTCTTTGC CGTTTCGCTG 
ACGCCAAGTC TCATACCGCG GCCCTACCTT ATTCAGGCGG TGATCTCGGG CTTCTCTCTC 
GCGGCGGGCT ACGCGATCGG CGTGTTCCTG CGCTGGCTCT GGTCCTTCTT CGAGCTTCCC 
GAACCGACGG TAAGGCGTGC ACGTACGCTG AAGATCGCCG CCGCCATCGT TTCGATTGCG 
GCCGCCGTCG TATTCCTATG GCAGGCTTCG CATTGGCAAA ACACCGTGCG GCACATTATG 
GGCCTGGAGC CGATCGAAAG CGCAGAGCCC GCCACTCTCG GCCTCATGGC CATTCTCGTA 
TTCGCCGCCC TGGTCCTGCT GGCACGGCTA TTCCGGCTGA CCTTTCGCGT GCTTTCACGA 
TGGCTGCAAT ATTTCCTCAC GCGGCCGGTT GCCAACGCGC TCGGCGGGCT CGTGGCGCTC 
GCCTTGTTCT GGTCTGCGGC GAACGGTGTG ATCTTCAAGT TCGCGCTTCG CGCTGCGGAC 
AGTTCCTTCC AGCAACTGGA TTCGCTCATC GATCCTGAGG TCGCACCGCC TGCGGATCCC 
GGCAAGACAG GCAGCGCCGC ATCGCTTGTG CACTGGGACG AGCTTGGACG GCAAGGGCGG 
CAGTTCATAG CCTCCGGGCC GACCGGCGCC GAAATCGGGG CGTTCTTCGG CATCGCGGCG 
CCGGAACCCG TCCGGGTTTA TGTGGGACTG AACTCTGCCG AAACGGCGCG GGAAAGGGCG 
AAGCTTGCGC TCGAGGAGTT GAAACGCGCC GGCGGCTTCG AACGCAAATC TCTGATCGTC 
ATCGTGCCGA CCGGCACCGG CTGGATTGAT CCGGAGGCGC TCGACACCCT CGAATATCTG 
CTTCACGGAG ATGTCGCGAG CGTGGCCGTA CAGTACTCCT ATCTCACCAG CTGGCTGTCG 
CTTCTGGTCG AGCCGAGTTA CGGCGCCGAA GCGGCCGACG CCCTCTTCGA CGAGATCTAC 
GGGCACTGGA CGACGCTGCC CAAGGATCGG CGGCCCAAGC TCTATCTCCA CGGTCTGAGC 
CTCGGGGCGA TGAATTCGCA GGGGTCGGTC GATCTCTTCG ACGTCATCAG CGATCCCTTT 
CAGGGCGCGC TCTGGAGCGG GCCGCCGTTC CAGAGCACCT TGTGGCGTTC GGTGACGGCG 
GACCGGGTAC CGGACTCACC TGCCTGGCTG CCGCGCTACC GCGACAGCTC CGCCATCCGC 
TTCACCAACC AGGAGAATGC CCTCGATATC CCCGGCGCGC ATTGGGGCGC GATGCGGATC 
GTCTACCTGC AATATGCCAG CGACCCGGTG ACGTTCTTCG ATCCCCATTC CTTTTATCGC 
GAGCCGGACT GGATGAGGTC GCCGCGAGGG CCGGACGTCT CACCGGCGCT GAGCTGGTTT 
CCCTTGGTCA CCGGTCTGCA ACTGCTGGCC GACATGGCGT TGGCGACGAC CTCTCCGATG 
GGCTACGGTC ACGTCTACGC CCCGGAACAC TACATTGACG CCTGGATGGC GGTCACCGAT 
CCGCCGGGGA TTACGGCGGC GGATGTGGCG CGGCTGAAAG CGCAATTCTC CGCGCGTTGA

Protein sequence

MEHVQQTDLP RPVPRRISNF LRSFSTSGLL IGVLFFAVSL TPSLIPRPYL IQAVISGFSL 
AAGYAIGVFL RWLWSFFELP EPTVRRARTL KIAAAIVSIA AAVVFLWQAS HWQNTVRHIM 
GLEPIESAEP ATLGLMAILV FAALVLLARL FRLTFRVLSR WLQYFLTRPV ANALGGLVAL 
ALFWSAANGV IFKFALRAAD SSFQQLDSLI DPEVAPPADP GKTGSAASLV HWDELGRQGR 
QFIASGPTGA EIGAFFGIAA PEPVRVYVGL NSAETARERA KLALEELKRA GGFERKSLIV 
IVPTGTGWID PEALDTLEYL LHGDVASVAV QYSYLTSWLS LLVEPSYGAE AADALFDEIY 
GHWTTLPKDR RPKLYLHGLS LGAMNSQGSV DLFDVISDPF QGALWSGPPF QSTLWRSVTA 
DRVPDSPAWL PRYRDSSAIR FTNQENALDI PGAHWGAMRI VYLQYASDPV TFFDPHSFYR 
EPDWMRSPRG PDVSPALSWF PLVTGLQLLA DMALATTSPM GYGHVYAPEH YIDAWMAVTD 
PPGITAADVA RLKAQFSAR