Gene Smed_1157 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_1157
Symbol
ID	5322003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	1231597
End bp	1232814
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	61%
IMG OID	640790098
Product	deoxyguanosinetriphosphate triphosphohydrolase-like protein
Protein accession	YP_001326843
Protein GI	150396376
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR00277] uncharacterized domain HDIG [TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.873553
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.980751
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGTCG ACAGGCAGGC CCTTGGTTTC GGTTACGGTG AACATGCAGC GTATGCTTCG 
AACCCGTGGG CTTCGCGTGG CAGGCTCTAT CCCGAGGCGT CGAGCCCGAC GCGTTCGGAT 
TTCCAGCGCG ACCGCGACAG GATCGTGCAT ACAACGGCAT TCCGGCGGTT GAAGCATAAG 
ACGCAGGTCT TCATTGCCGC CGACGGTGAT CACTACCGCA CCCGGCTAAC CCATACGATC 
GAAGTCGCCC AGATCGCGCG CGCACTCGCC AGAGCGTTGA ACCTGGACGA GGATCTCGCA 
GAAGGCGTGG CGCTCGTCCA CGACTTCGGC CACACTCCCT TCGGGCACAC CGGCGAGGAC 
GCGCTTGACG AGGTCCTGAA GCCCTATGGA GGGTTCGACC ATAACGCGCA GTCGCTGAGA 
ATCGTCACCA AGCTGGAGCG GCGCTATGCG GAGTTCGATG GCCTCAATCT CACTTGGGAG 
AGTCTCGAGG GGCTCGTCAA ACATAACGGC CCCCTGACGA CGGCGGACGG CCAGGGGCTT 
CGCGGCCCGG TCTCGCAGCC GATCCTCGAC TACTGTGCTC TTCACGATCT CGAACTCGCG 
AGCTTTGCAA GCCTCGAAGC GCAGGTTGCG GCAATCGCCG ATGATATCGC CTATAATACC 
CACGATATCG ATGACGGTCT GCGCGCCGGC TATCTCACCT TCGAAATGCT GGAGGAGATA 
CCGTTTCTCG CCCGGTTGAT GTACGAGGTT CGCGACCGCT ATCCGGGCCT TGAAAGCAGC 
CGGTTCACGC ATGAGATCAT GCGGCGGCAG ATCACCGCCA TGGTGGAAGA CGTCATCGGC 
GTTTCGCAGA GAGGGCTTGC GGACGTCCGG CCCGCAAGCG CAAGGGACGT GCGTTGCGCC 
GGCAGGGTCA TCGCGACCTT CTCGGACGAA ATGAGCGAGA CGGACCGTCA GATCAAAAAT 
CTGCTGATGA CGCGCATTTA CCGGCATCCG GAGGTCATGC GGGTACGAGA GGGAGCGGCA 
TCGATCGTGA CGGACCTCTA CCGTGCCTTC ATGGACGATC CTTCGCTCAT GAAGGAACAC 
TATTGGATCG ATCAGATCGC GGGGATGGAG GAGCCGGCCC GGGCCCGCCA TGTGGGGGAT 
TATCTCGCCG GTATGACGGA TACTTTCGCG ATCAGCGTGC ATAGGCGTTT GTTTGACCAC 
ACGCCCGATT TGCGCTAG

Protein sequence

MTVDRQALGF GYGEHAAYAS NPWASRGRLY PEASSPTRSD FQRDRDRIVH TTAFRRLKHK 
TQVFIAADGD HYRTRLTHTI EVAQIARALA RALNLDEDLA EGVALVHDFG HTPFGHTGED 
ALDEVLKPYG GFDHNAQSLR IVTKLERRYA EFDGLNLTWE SLEGLVKHNG PLTTADGQGL 
RGPVSQPILD YCALHDLELA SFASLEAQVA AIADDIAYNT HDIDDGLRAG YLTFEMLEEI 
PFLARLMYEV RDRYPGLESS RFTHEIMRRQ ITAMVEDVIG VSQRGLADVR PASARDVRCA 
GRVIATFSDE MSETDRQIKN LLMTRIYRHP EVMRVREGAA SIVTDLYRAF MDDPSLMKEH 
YWIDQIAGME EPARARHVGD YLAGMTDTFA ISVHRRLFDH TPDLR