Gene Mmar10_1914 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_1914
Symbol
ID	4286432
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	-
Start bp	2094437
End bp	2095711
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	62%
IMG OID	638141414
Product	putative deoxyguanosinetriphosphate triphosphohydrolase
Protein accession	YP_757144
Protein GI	114570464
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTCGG CCGTACGGCC TTTGGATTGT GTCGTCTTGG TCTTATATGG ACCTCCCCCC 
GCGCGGATAA AAGGCCCTGC TGACATGACC ATTGCCGCGA CCGAGCGTAC CCGTGCCCCC 
TATGCCTGCC ATCCAGCCCA ATCACGCGGG CGCCGTTTTC CGCAGGCTGA CAGCGCCATG 
CGCAATGCAT TCCAGCGCGA TCGTGACCGA GTCATACACT CGGCGGCCTT TCGCCGGCTG 
AAGGGAAAGA CCCAGGTATT TGTGGCCCAT GAGGGCGATC TCTATCGCAC CCGTCTGACC 
CATTCCCTGG AAGTGTCACA GATCGCCCGC ACGCTGGCGC GGGCCTTGCG CGGCGATGAG 
GACCTGGCCG AGGCGCTCGC TCTCGCCCAT GATCTGGGGC ATCCGCCGTT CGGGCATGAG 
GGCGAGCGTG AGCTGGCCCT GAAGATGAAG GATTTCGGCG GCTTTGATCA CAACGCCCAG 
ACCCTGCGCG CGATCACCAA GCTGGAAGTG CGCTATCCCG AGTTCGATGG CCTCAACCTG 
ACCTGGGAAA CCCTGGAAGG TGTCGTCAAG CATAATGGCC CCTTGCTCGG GCCGGGGCAG 
ACGGAAGCCG ATCTGCCCTG GGCTTTCACT GACTATGAGG GCTGGCGAGA CCTCGAATTC 
GAAACCCATG CCGGCCTCGA GGCCCAGATC GCGGCGCTGG CAGATGATAT CGCCTACAAT 
AATCACGACA TTGATGACGG GTTGAGTTCC GGCCTGCTGG AAATCGAGCC TCTGCTCGAG 
CTGCCGCTGG TCGGCGATAT ATTCCGCCGG GTCCGGGAGC GGTGGCCGGA CAAGCCGCAA 
ACCATCATTA TCCATGAAGC GGTGCGCGAA CTGATCGGCG TCATGGTGGC GGATGTCCTC 
GCAGAATCCG GCAAACGGCT TGATCGGGCC CGTCCCGACA GCGCCCAGGC CCTGCGTGAG 
CTGGATCACC CGGTGGTGGC TTTTTCCGAG GAAATGGTGC TGCATCTCGC CGCGCTGCGC 
CGCCATCTCT TTGCCCACAT GTATCGGCAC TACAAGGTCA ACCGGATGAT GAGCCAGGCG 
CGCCGGGTGA CCGGCGAACT GTTTGACCTG TATCTGGCCG ATCCGGGTGT CTTGCCCAGC 
GATGTGCAGG CAGGCATGAC AGGTGCCGGT ACCGCGCAGA CAGCGCGCGC GGTTTGCGAC 
TATATCGCCG GCATGACGGA TCGCTTTGCA GTGGAAGAGC ACAGACGGCT TTTCACCGTG 
CAGGGGTATT TCTAG

Protein sequence

MLSAVRPLDC VVLVLYGPPP ARIKGPADMT IAATERTRAP YACHPAQSRG RRFPQADSAM 
RNAFQRDRDR VIHSAAFRRL KGKTQVFVAH EGDLYRTRLT HSLEVSQIAR TLARALRGDE 
DLAEALALAH DLGHPPFGHE GERELALKMK DFGGFDHNAQ TLRAITKLEV RYPEFDGLNL 
TWETLEGVVK HNGPLLGPGQ TEADLPWAFT DYEGWRDLEF ETHAGLEAQI AALADDIAYN 
NHDIDDGLSS GLLEIEPLLE LPLVGDIFRR VRERWPDKPQ TIIIHEAVRE LIGVMVADVL 
AESGKRLDRA RPDSAQALRE LDHPVVAFSE EMVLHLAALR RHLFAHMYRH YKVNRMMSQA 
RRVTGELFDL YLADPGVLPS DVQAGMTGAG TAQTARAVCD YIAGMTDRFA VEEHRRLFTV 
QGYF