Gene Smed_6252 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_6252
Symbol
ID	5320554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	-
Start bp	1172452
End bp	1173492
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	59%
IMG OID	640777852
Product	luciferase family protein
Protein accession	YP_001314784
Protein GI	150378189
COG category	[C] Energy production and conversion
COG ID	[COG2141] Coenzyme F420-dependent N5,N10-methylene tetrahydromethanopterin reductase and related flavin-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.905079
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.361259
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATTCT CACTCTTCGT TCACATGGAG CGCCTGGATG CTTCGCAAGA CCACAGGACG 
CTTTACGAAG AATTCATCAA GCTGTGCGAA GTCGCCGACA AAGGCGGCAT GCACGCGATC 
TGGACCGGTG AACATCATGG AATGGAGTTC ACCATTGCGC CGAATCCCTT CATAACGATT 
GCCGACCTTG CCCGCCGCAC TAAGACCGTG CGGCTTGGAA CCGGCACGGT GATCGCGCCC 
TTCTGGCATC CGATCAAGCT CGCGGGAGAA GCCGCAATGA CGGATCTGAT CTGCGAGGGT 
CGCCTCGACA TCGGAATTGC CCGCGGCGCC TATTCCTTCG AGTACGAGCG GCTGCTGCCG 
GGCCTCGACG CCTGGAGCGC TGGGCAGCGC ATGCGCGAAC TCATTCCGGC GGTGAAGGGG 
ATCTGGGCGG GTGATTACGC CCACGACGGC GAGTTCTTCA AGTTTCCGGC CACGACCTCG 
TCACCGAAGC CGCTGCAGAA GCCCCATCCG CCGATATGGG TTGCTGCGCG CGACCCCAAC 
TCGCACGAGT TTGCCGTTTC GAACGGCTGC AATGTGCAGG TGACGCCACT CTGGCAGGAC 
GACGAGGAGG TTCGGAGCCT GATGGGACGG TTCAACGACG CCTGCGCCAA GGATCCAGAG 
GTCCCGCGCC CGAAGATCAT GCTGCTGCGG CACACCTATG TCGGCTCCGA CGAGGCGGAT 
ATCGCGCAGG CAGCTCATGA GATGAGCGTA TACTACAATT ACTTCTTCGC CTGGTTCAAG 
AACGAAAGAC CGATCAGACA AGGCCTCATT GATCGGATTC CGGACGAGGA AATTGCCGCC 
AATGCCATGC TCTCAGGCGA GGCAATGCGA CGCAACAACG TCGTCGGCGC AGCCGACGAG 
GTCATCGCCC GCATCAAGAG CTACGAGGCA ATGGGATATG ACGAATATTC CTTCTGGATA 
GACACAGGCA TGACCTTCGA GCGCAAGAAG GCTTCGCTCG AACGCTTCAT CGCCGATGTC 
ATGCCAGCAT TTGCGGAGTA G

Protein sequence

MKFSLFVHME RLDASQDHRT LYEEFIKLCE VADKGGMHAI WTGEHHGMEF TIAPNPFITI 
ADLARRTKTV RLGTGTVIAP FWHPIKLAGE AAMTDLICEG RLDIGIARGA YSFEYERLLP 
GLDAWSAGQR MRELIPAVKG IWAGDYAHDG EFFKFPATTS SPKPLQKPHP PIWVAARDPN 
SHEFAVSNGC NVQVTPLWQD DEEVRSLMGR FNDACAKDPE VPRPKIMLLR HTYVGSDEAD 
IAQAAHEMSV YYNYFFAWFK NERPIRQGLI DRIPDEEIAA NAMLSGEAMR RNNVVGAADE 
VIARIKSYEA MGYDEYSFWI DTGMTFERKK ASLERFIADV MPAFAE