Gene Smed_1152 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1152
Symbol
ID	5321998
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1226053
End bp	1227300
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	59%
IMG OID	640790093
Product	aromatic hydrocarbon degradation membrane protein
Protein accession	YP_001326838
Protein GI	150396371
COG category	[I] Lipid transport and metabolism
COG ID	[COG2067] Long-chain fatty acid transport protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0462586
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCGGA TTGGATTGAA GCGGGGTGTT CTGGCTGCGG TTGCCGGAAT GCTCGTGGCC 
TCGGCTGCGC AGGCGGGAGG GCTGGAGCGC AGCGGCTATA ATATCGATCT TCTGTTCGAC 
CCGTCGGACT ATGCGGCCGA AGCGACGGCG ACCTACGTTA ATCCGCAGCG TGAGCTGAAG 
AATGTCGCCG ATATCAACCC GGCAAATGGG ATCGGCTCCA ACGGGATCGG TGGGGGAAGC 
ACAAGCGTTC GGGACACGGA GAGTTATTGG GCGCCCCGTA TTGGAGTAAA GGCTGGTCTG 
GGTGACAGCA TTGACTGTAT GGCGGACTAC TCCCAGCCTT GGGGCGCCCA CACCAATCCA 
GGCAAGAATT GGATGGGTGC GAACGACAAC ATCGAAACGA AAGTCGAAAG CGACAATTAT 
GCGGCCACCT GCTCCTATAA GTGGGACGTA GGCCCCGGTG TCGTGCGCAT CATCGGCGGT 
GGTTTCTACC AGGAAATCGG CGGCTTCAAA GATAGGCTCG TCGCCCCCGA AATCGCGGTA 
GCGCCGCTTA CCGGTGTTGG CCGACTTGAA CTCGAAGGCG AGGCGTGGGG TTGGCGCACC 
GGTATCGCCT ATGAGATTCC GGAATATGCA ATGCGGGCAA GTCTCGTCTA CAACAGCAAG 
GTCGACTATG ACGATTTGTC CGGATTCATT GACCTGACGC AGTTCGCATT CCCGACGCCA 
GGTGGACCGA TCCGTGGCAC CAAATACGAT GTTTCGGGTT CCGCCTCGAT GCCGGACTCG 
CTGGAACTAA AGGTGCAGTC CGGTATTGCT CCTGGTTGGT TGGCTTTCGG CTCGGTCAAG 
TGGACGGACT GGAGCCAATT GCAAGTCCTC GAGTTCTGCC CGGCGACCGC CTCACCGCTT 
ACGCCGTGCA CCACCCTTGA TCTCCTTTAT CGCGACGGTT GGACCGTTAC CGGCGGCGTC 
GGCCATAAGT TCAACGATCA GTGGAGCGGC GCGGTCAGCC TCACCTGGGA CCGCGGTACG 
AGTCACGGCT ATGGCACCCA GACCGACACG TGGCTGCTGG GATCCGGCGT CTCCTATACT 
CCGACGGAGA ACGTCGAACT TCGCCTCGCT GGCAGTGTCG GTATTTTGAC CAGCGGGAGT 
TCCGGCCCGG TCAGTTTCAA TGGCGAGAGG ATCGGCAATG AGGTCACCTA CGATTTCGAC 
AACGACTTCG TCGGGGCGAT CTCGACATCG CTGAAGGTCA GGTTCTGA

Protein sequence

MARIGLKRGV LAAVAGMLVA SAAQAGGLER SGYNIDLLFD PSDYAAEATA TYVNPQRELK 
NVADINPANG IGSNGIGGGS TSVRDTESYW APRIGVKAGL GDSIDCMADY SQPWGAHTNP 
GKNWMGANDN IETKVESDNY AATCSYKWDV GPGVVRIIGG GFYQEIGGFK DRLVAPEIAV 
APLTGVGRLE LEGEAWGWRT GIAYEIPEYA MRASLVYNSK VDYDDLSGFI DLTQFAFPTP 
GGPIRGTKYD VSGSASMPDS LELKVQSGIA PGWLAFGSVK WTDWSQLQVL EFCPATASPL 
TPCTTLDLLY RDGWTVTGGV GHKFNDQWSG AVSLTWDRGT SHGYGTQTDT WLLGSGVSYT 
PTENVELRLA GSVGILTSGS SGPVSFNGER IGNEVTYDFD NDFVGAISTS LKVRF