Gene Smed_3938 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_3938
Symbol
ID	5318519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	388528
End bp	389817
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	64%
IMG OID	640775748
Product	hypothetical protein
Protein accession	YP_001312681
Protein GI	150376085
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.350729
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGAAG CAATTCCAGG AAGGGTGCGC AGCGGTTTTC CGTCCGGAAT TGCCGAGAAA 
CGGACGGTTC GAGCAACTCC GCGATTCAGA GAAAAGGGGA AGTGCCCTCA CCTATCGGGT 
CTGCTCGCCC TTTTCTGGGT GGCCATGCTT GTCACCTCTC CCTCGCAGGC GGCGGAGGTG 
AAGACGGCGG TGCTCAGGAT CGATCGCGTC GTCGGTCCGC CGATCTCGCG GCTCGATGCG 
CCGCCCGCCG ATCTGGGCTT TGCCGGCGCC ATGCTGGGCA ATGAGGACAA TCGGACGACC 
GGTGCCTTCA CGGGCATGGA TTACACGGTG ACGACGCAGG CGGTTGCACC GGAAGAGGCA 
GGGGCGGCGC TCGACGGGCT GAAGGCGGAA GGCATCGGCC TCATCGCCGT GATCGCCGAA 
GGCGACATCC TGAAGGAACT GTCAGAAAAG GCCGGGCCGG GGGTACTGCT CTTCAACGCC 
GGCGCGCGCG ACGACGGGTT GCGCGATGCG GACTGCCTGG CGAATGTGCT GCATGTCTCA 
CCCAGCCGCT CGATGCTCAG CGACAGTATC GTGCAGTTCC TGATGTGGAA GAAATGGCCT 
CGTATCCTGC TGATCCACGG CTCGCATCCG GAAGACAGGC TGCTGGCCGA AAGCTACCGC 
AAATCGGCCG CCAAATTCGG CGCGAAGATC GTAGAAGAGC GCGAATTCGT CGATACCGGC 
GGCAGCCGGC GAACGGATAC CGGCCATGTC ATGGTGCAAA AGCAGATTCC CGTCTTCACA 
CAGGAAGCCG AGCCCTATGA CGTCATCGTC GCGGCCGACG AAGCAGGCGT CTTCGCGCCC 
TATCTGCCTT ACCACAGCTG GGATCCGAGG CCCATCGCCG GATCGGCCGG ACTTCGCCCT 
GTCTCCTGGC ATCCCGCCCA CGAGGCGTGG GGCGCGACCC AGTTCCAGCG CCGCTTTGAG 
AAGCTTACCG GCCGTTACAT GCGCGAGGAA GACTATCAGG CGTGGCTTGC CATGCGGGTG 
ATCGGGGAGG CGGTGACCCG CTCCGGCAAG GCCGATCCCG CAACCGTGCG GGCCTATGCC 
CTTTCGAAGG ACTTCGAACT GGCCGCGTTC AAGGGTCAGA AGCTGACCTT CCGCACCTGG 
AACGGGCAGC TGCGGCAGCC GGTCCTTCTG ACCGAAGGCC GGGTGACGGT CTCCGTTTCT 
CCGCAGGACG GTTACCTGCA TCAGCATTCG CCGCTCGACA CGCTGGGCAT CGATGCGCCC 
GAAACCGCCT GCCAGGCCTT TGGAGGATAA

Protein sequence

MLEAIPGRVR SGFPSGIAEK RTVRATPRFR EKGKCPHLSG LLALFWVAML VTSPSQAAEV 
KTAVLRIDRV VGPPISRLDA PPADLGFAGA MLGNEDNRTT GAFTGMDYTV TTQAVAPEEA 
GAALDGLKAE GIGLIAVIAE GDILKELSEK AGPGVLLFNA GARDDGLRDA DCLANVLHVS 
PSRSMLSDSI VQFLMWKKWP RILLIHGSHP EDRLLAESYR KSAAKFGAKI VEEREFVDTG 
GSRRTDTGHV MVQKQIPVFT QEAEPYDVIV AADEAGVFAP YLPYHSWDPR PIAGSAGLRP 
VSWHPAHEAW GATQFQRRFE KLTGRYMREE DYQAWLAMRV IGEAVTRSGK ADPATVRAYA 
LSKDFELAAF KGQKLTFRTW NGQLRQPVLL TEGRVTVSVS PQDGYLHQHS PLDTLGIDAP 
ETACQAFGG