Gene Smed_4903 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_4903
Symbol
ID	5317880
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009620
Strand	-
Start bp	1412815
End bp	1414074
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	56%
IMG OID	640776687
Product	RNA-directed DNA polymerase (Reverse transcriptase)
Protein accession	YP_001313619
Protein GI	150377023
COG category	[L] Replication, recombination and repair
COG ID	[COG3344] Retron-type reverse transcriptase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.791512
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.702459
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTCGA TAGATACGAC AGACAAGCCG TTTCGAATTG AGAAGCGGCA AGTGTACGAA 
GCTTACAAAG CGGTCAAAGC CAACCATGGC GCAGCCGGAG TGGACGGTGA GACCTTGGAG 
ATGTTCGAGA AAGACCTTGC GAGAAATCTC TACAAGATCT GGAATCGGAT GTCGTCCGGG 
ACCTACTTTC CGCCACCGGT GCGCGCCGTC TCCATTCCGA AGAAGACTGG TGGCGAAAGG 
GTTTTGGGTG TGCCCACGGT CAGCGATCGG ATCGCGCAGA TGGTGGTCAA GCAGATGATT 
GAGCCGGATT TGGATTCCCT CTTTCTTCCG GACTCCTACG GATACAGGCC GGGAAAATCG 
GCGTTGGATG CCGTTGGGGT GACGCGTCAG CGGTGCTGGA AGTACGATTG GGTTCTGGAA 
TTCGACATCA AAGGGCTGTT TGACAATCTT CCGCATGATC TCTTGCTGAA GGCGGTCAGA 
AAGCACGTCA AATGCAACTG GGCTCTGCTC TACATCGAAA GATGGCTGGT CGCGCCCATG 
GAAAAGAACG GAGCAGTCAT TGAGCGCACA CGTGGTACCC CGCAAGGGGG CGTGGTCAGC 
CCAATCCTCT CGAATCTCTT CCTGCATTAC GCGTTCGACG TCTGGATGAC TCGGACGCAC 
CCTGATCTTC CATGGTGTCG GTATGCCGAT GATGGTCTCG TGCACTGCCG GACCGAGCAA 
GAAGCACAGG CCCTCAAGGC TGCGCTTCAA GCCCGGCTGG CAGAATGCGG ACTTCAGATG 
CATCCGATCA AGACCCAGAT CGTCTACTGC AAAGATAATC GGCGTCGGAA AAGGTATCCG 
ACCGTCAAAT TTGACTTCCT TGGATACCAA TTCCGGCCGC GACAGGTGGC GACGGCGCAG 
CAGGATGAGT TCTTCTGCGG CTACACCCCG GCGGCCAGCC CGACGGCGCT AAAGTCGATG 
CGGGCCACGA TCAAGAGCTT GAACATTCCG CGGCAAACGC CGGGGACGCT GGCTGAAATC 
GCCAAACAGA TCAATCCGCT CCTGCGGGGA TGGATTGCCT ATTATGGGCG GTTCAGTCGT 
TCGGCCCTGT TCTCTCTGGC TGACTACATC AATCGGAAGC TCAAGGCCTG GATTATGCGA 
AAGTACAAGC GCTTTCGGTT CCACAAAACT CGGGCTTCGC AGTTCTTGCG GCAACTTGCT 
CGAGATAATC GGGGCCTCTT CGTACACTGG CAGGCGTTCG GAACGAACCT GTTTGCCTGA

Protein sequence

MTSIDTTDKP FRIEKRQVYE AYKAVKANHG AAGVDGETLE MFEKDLARNL YKIWNRMSSG 
TYFPPPVRAV SIPKKTGGER VLGVPTVSDR IAQMVVKQMI EPDLDSLFLP DSYGYRPGKS 
ALDAVGVTRQ RCWKYDWVLE FDIKGLFDNL PHDLLLKAVR KHVKCNWALL YIERWLVAPM 
EKNGAVIERT RGTPQGGVVS PILSNLFLHY AFDVWMTRTH PDLPWCRYAD DGLVHCRTEQ 
EAQALKAALQ ARLAECGLQM HPIKTQIVYC KDNRRRKRYP TVKFDFLGYQ FRPRQVATAQ 
QDEFFCGYTP AASPTALKSM RATIKSLNIP RQTPGTLAEI AKQINPLLRG WIAYYGRFSR 
SALFSLADYI NRKLKAWIMR KYKRFRFHKT RASQFLRQLA RDNRGLFVHW QAFGTNLFA