Gene Smed_1223 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1223
Symbol
ID	5322070
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1306022
End bp	1307281
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	56%
IMG OID	640790164
Product	RNA-directed DNA polymerase (Reverse transcriptase)
Protein accession	YP_001326908
Protein GI	150396441
COG category	[L] Replication, recombination and repair
COG ID	[COG3344] Retron-type reverse transcriptase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0131896
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.0593975
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTCGA TAGATACGAC AGACAAGCCG TTTCGAATTG AGAAGCGGCA AGTGTACGAA 
GCTTACAAAG CGGTCAAAGC CAACCATGGC GCAGCCGGAG TGGACGGTGA GACCTTGGAG 
ATGTTCGAGA AAGACCTTGC GAGAAATCTC TACAAGATCT GGAATCGGAT GTCGTCCGGG 
ACCTACTTTC CGCCACCGGT GCGCGCCGTC TCCATTCCGA AGAAGACTGG TGGCGAAAGG 
GTTTTGGGTG TGCCCACGGT CAGCGATCGG ATCGCGCAGA TGGTGGTCAA GCAGATGATT 
GAGCCGGATT TGGATTCCCT CTTTCTTCCG GACTCCTACG GATACAGGCC GGGAAAATCG 
GCGTTGGATG CCGTTGGGGT GACGCGTCAG CGGTGCTGGA AGTACGATTG GGTTCTGGAA 
TTCGACATCA AAGGGCTGTT TGACAATCTT CCGCATGATC TCTTGCTGAA GGCGGTCAGA 
AAGCACGTCA AATGCAACTG GGCTCTGCTC TACATCGAAA GATGGCTGGT CGCGCCCATG 
GAAAAGAACG GAGCAGTCAT TGAGCGCACA CGTGGTACCC CGCAAGGGGG CGTGGTCAGC 
CCAATCCTCT CGAATCTCTT CCTGCATTAC GCGTTCGACG TCTGGATGAC TCGGACGCAC 
CCTGATCTTC CATGGTGTCG GTATGCCGAT GATGGTCTCG TGCACTGCCG GACCGAGCAA 
GAAGCACAGG CCCTCAAGGC TGCGCTTCAA GCCCGGCTGG CAGAATGCGG ACTTCAGATG 
CATCCGATCA AGACCCAGAT CGTCTACTGC AAAGATAATC GGCGTCGGAA AAGGTATCCG 
ACCGTCAAAT TTGACTTCCT TGGATACCAA TTCCGGCCGC GACAGGTGGC GACGGCGCAG 
CAGGATGAGT TCTTCTGCGG CTACACCCCG GCGGCCAGCC CGACGGCGCT AAAGTCGATG 
CGGGCCACGA TCAAGAGCTT GAACATTCCG CGGCAAACGC CGGGGACGCT GGCTGAAATC 
GCCAAACAGA TCAATCCGCT CCTGCGGGGA TGGATTGCCT ATTATGGGCG GTTCAGTCGT 
TCGGCCCTGT TCTCTCTGGC TGACTACATC AATCGGAAGC TCAAGGCCTG GATTATGCGA 
AAGTACAAGC GCTTTCGGTT CCACAAAACT CGGGCTTCGC AGTTCTTGCG GCAACTTGCT 
CGAGATAATC GGGGCCTCTT CGTACACTGG CAGGCGTTCG GAACGAACCT GTTTGCCTGA

Protein sequence

MTSIDTTDKP FRIEKRQVYE AYKAVKANHG AAGVDGETLE MFEKDLARNL YKIWNRMSSG 
TYFPPPVRAV SIPKKTGGER VLGVPTVSDR IAQMVVKQMI EPDLDSLFLP DSYGYRPGKS 
ALDAVGVTRQ RCWKYDWVLE FDIKGLFDNL PHDLLLKAVR KHVKCNWALL YIERWLVAPM 
EKNGAVIERT RGTPQGGVVS PILSNLFLHY AFDVWMTRTH PDLPWCRYAD DGLVHCRTEQ 
EAQALKAALQ ARLAECGLQM HPIKTQIVYC KDNRRRKRYP TVKFDFLGYQ FRPRQVATAQ 
QDEFFCGYTP AASPTALKSM RATIKSLNIP RQTPGTLAEI AKQINPLLRG WIAYYGRFSR 
SALFSLADYI NRKLKAWIMR KYKRFRFHKT RASQFLRQLA RDNRGLFVHW QAFGTNLFA