Gene Smed_5412 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5412
Symbol
ID	5319714
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	375289
End bp	376527
Gene Length	1239 bp
Protein Length	412 aa
Translation table	11
GC content	61%
IMG OID	640777178
Product	hypothetical protein
Protein accession	YP_001314110
Protein GI	150377515
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2843] Putative enzyme of poly-gamma-glutamate biosynthesis (capsule formation)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.264785
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGACA GGTTCACATT GGCCGTAACC GGCCAATCGC TCATCAAGCA CGATATCCGC 
GACATTCCTG CTCCTGCCTT CCGTGAGATT CAGTCCCTCC TTCGCCAGGC GGATCTCTCA 
TTTACCAACT TCGAGGGAAC GATCCTTGGG CGTCACGGCG GGTGGCCGCT CAAAGGTTCG 
TTCTTCGGGT GCAGCGACCC GGCCGTTCTC GATGCACTTG GCGCCATCGG CTTTCAGGCA 
CTGTCCCTTT CGAACAATCA TGCCTTCGAC CTCGGACCTT CAGGTGTGCT TTCGACGCTC 
GAGGAGGTGG AGAAACGAGG CTTTCTCCAT GCCGGTCTCG GCCGCAACGC GCGAGAGGTC 
TCGCGTGCGA GCATTGCCAC GATCAACCAA CGGCGTATTG CCCTCGTTGC GATGGACGGT 
GGCCCCGGAC CCGATTTCAT GTATGCCGCG GACGCGGACG AAAATCGCCC CGAACGCCCC 
GGTGTGAACC GGCTTCGTCT TTCACAGCTC CTCGAGGTCG ACGATGTCGC GTTTGAGCAG 
ATCCGGGCGG TTCGCGACAA GATCGGCTAC ACTGCCATCG ACCTCGCCAA TGACAGCCAG 
CCGGACGATC CCCCGCGCCT CGACCCGCAG GCTGAGGTCG CTATCGCCCG CTGTGTCTTC 
AAACGGTCCG ACCGGTACGG ACGCGGTGTA AGGATAGATG AGGTCGACAT GGCAAGAAAC 
CTTGCCGCGA TCGCCTCTGC AGCCAGGGAC GAGGCACTGG TGATCGCCTA TCTCCATCAT 
CATCACTGGG CCTCCGACTG GTATCAGCTG CCCGAATGGG TGAGCGGTGT GGCCAAACGA 
TGCATCGACG CAGGCGCGTC CATGTTTGTC AGTCACGGCG CGCCGGTGCT GCAACCGGTC 
GAAATCTATC GAGGCCGGCC AATCTTCTAC AGCCTGGGTA ATTTCATCTT CCATGTCCGA 
TCGGAGAAGT CGACCTGGAC CGCAGCGGAA GTCTGGGAAA GTGTCGTCGG GGTTTGCTCC 
TTTGCCAGCG ACAACAGCCT CATCGACATC AGCTTCCATC CCGTCGTCAT CGGGGGCGAC 
GATGGATTGG AGGACGGGGT GTTGGAACGT CGGCTGGTTC CACAGCTTGT AACCGGAGAC 
AGCGCGGTCA GGATCCTTGG CCGGCTTCAG GAGCAATCTG CGCGACTGGG CGCGCATATA 
GAAATCTCCG GCAACGTCGG CAGGCTGCAA GCGCGATAG

Protein sequence

MNDRFTLAVT GQSLIKHDIR DIPAPAFREI QSLLRQADLS FTNFEGTILG RHGGWPLKGS 
FFGCSDPAVL DALGAIGFQA LSLSNNHAFD LGPSGVLSTL EEVEKRGFLH AGLGRNAREV 
SRASIATINQ RRIALVAMDG GPGPDFMYAA DADENRPERP GVNRLRLSQL LEVDDVAFEQ 
IRAVRDKIGY TAIDLANDSQ PDDPPRLDPQ AEVAIARCVF KRSDRYGRGV RIDEVDMARN 
LAAIASAARD EALVIAYLHH HHWASDWYQL PEWVSGVAKR CIDAGASMFV SHGAPVLQPV 
EIYRGRPIFY SLGNFIFHVR SEKSTWTAAE VWESVVGVCS FASDNSLIDI SFHPVVIGGD 
DGLEDGVLER RLVPQLVTGD SAVRILGRLQ EQSARLGAHI EISGNVGRLQ AR