Gene Smed_4400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4400
Symbol
ID	5319165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	+
Start bp	896185
End bp	897462
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	66%
IMG OID	640776204
Product	hypothetical protein
Protein accession	YP_001313137
Protein GI	150376541
COG category	[S] Function unknown
COG ID	[COG1415] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.901272
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.333483
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCAAA GGGCAGGTAA TGCGGATCTC CCGCTGCATG GCGGCCGGGT GCCGCGGTGG 
CTCGGCGATC GCATGACGCG CTTGGGCGCG CTGGTCACCG AAGCGATCGT ACATCACTAT 
GGACGCGACG AGTTTTTGAG GCGCCTGGCG CATCCGTTCT GGTTCCAGTC CTTCGGTGCC 
GTAATGGGAA TGGACTGGCA TTCGTCCGGG ATCACCACGA GCGTCATCGG GGCGCTGAAA 
CGCGGCCTCA CGCCCCTTGC CGGCGAGCTC GGCATCCATG TTTGCGGCGG CCGCGGCCAG 
CACTCCCGCA AGACGCCCGG CGAACTCGTC TCGATCGGCG ATCGCATCGG TTTCGACGGC 
GGCGCAATGG CGGAGGCGAG CCGACTCGTA GCAAAAGTGG ACAGTGCCGC CGTTCAGGAC 
GGCTTCGACC TCTACCTGCA TGGCTTCATC ATCACGGACG ATGCCAAATG GGTGGTCGTC 
CAACAGGGCA TGAACGGCGA CCGGCGCCAG GCGAGGCGCT ATCACTGGCT TTCCGAAGGG 
TTGACGAGCT TCGTCGATGC GCCGCACAGC GCGATAGAGG GCAGAGGACA GGGCGAAATC 
TTCAATCTCG CAGACCGCCG GGCTGCCGCG TCGCGGAGTG CGCAGCTCGA TCTCCTCCAC 
TCACTCGGGC CCGACGGACT CTTGCGTGAG GTCGCCTCGA TCGAGGCTCG CGCTGCTCCT 
CAGGCAGAGC CGGCACAGCC GCTGCTGCCG CATCTCTTCA TGCCCGCCCA TCACGAGGTT 
CGTGAATCCG ACGTCAATCT CCGGCGCCTT CACGGCAGCT TCGCCGCGGC CGCCGAGCGC 
GGACCTGAAG ACTTCAAGGA CCTGCTCCTC GTGCCGGGGG TCGGGGCCCG GACGGTCAAA 
GCACTGGCGA TGGTCGCGGA GGTCGTTCAC GGAACGCCGT GCAGGTTCTC CGATCCCGCC 
CGCTTTTCGC TCGCCCATGG CGGCAAGGAC CGTCATCCGT TTCCGGTTCC GTTGAAAGTT 
TATGACGAGA CTATCGGCGT CATGAAGTCC GCGGTGAGTA AGGCCCGGCT CGGGCGCGAG 
GAGGAGCTTG CGGCGCTGAA GCGACTTGAC GAGCAGTCGC GACGGCTGGA ACGCTACGTC 
ACCGGCCCTG ACCTCAAGGA GATCGTCGCG GGCGAATTCA GGGACTCCGC GCGTTTCGGC 
GGGCGCAGCA TCTTCGGCTG GGAACCGCCC GAGGAAGAAA CGATCATTTC CGAGCCGGGC 
GACCGCGCGC GGCGTTGA

Protein sequence

MAQRAGNADL PLHGGRVPRW LGDRMTRLGA LVTEAIVHHY GRDEFLRRLA HPFWFQSFGA 
VMGMDWHSSG ITTSVIGALK RGLTPLAGEL GIHVCGGRGQ HSRKTPGELV SIGDRIGFDG 
GAMAEASRLV AKVDSAAVQD GFDLYLHGFI ITDDAKWVVV QQGMNGDRRQ ARRYHWLSEG 
LTSFVDAPHS AIEGRGQGEI FNLADRRAAA SRSAQLDLLH SLGPDGLLRE VASIEARAAP 
QAEPAQPLLP HLFMPAHHEV RESDVNLRRL HGSFAAAAER GPEDFKDLLL VPGVGARTVK 
ALAMVAEVVH GTPCRFSDPA RFSLAHGGKD RHPFPVPLKV YDETIGVMKS AVSKARLGRE 
EELAALKRLD EQSRRLERYV TGPDLKEIVA GEFRDSARFG GRSIFGWEPP EEETIISEPG 
DRARR