Gene Sama_1695 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sama_1695
Symbol
ID	4603946
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella amazonensis SB2B
Kingdom	Bacteria
Replicon accession	NC_008700
Strand	-
Start bp	2074604
End bp	2075935
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	55%
IMG OID	639781058
Product	deoxyguanosinetriphosphate triphosphohydrolase-like protein
Protein accession	YP_927571
Protein GI	119774831
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.203365
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0318117
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACAATC CATGGCATGA GCGCCGCCAC GGCGAAGAAA AACACAGACG CAACGACCAT 
AGAAGTCCAT TTCAGCGTGA CCGTGCCCGA GTGCTGCACA GTGCCGCCTT CCGGCGTTTG 
CAGGCCAAGA CCCAGGTACT TGGCGTAGGG ATGAACGACT TTTACCGCAC CCGCCTCACC 
CACTCGTTGG AAGTGTCGCA AATCGGCACC GGCATTGCCG CCCAGCTTAA GCGCAAACAT 
CCGGATAAAG AGTCGCTGAT TGACTCCATG AGCCTGATTG AATCCCTGTG TCTTGCCCAC 
GATATAGGTC ATCCGCCCTT CGGCCACGGC GGAGAGGTCG CGCTCAATTA CATGATGCGC 
GACCACGGCG GCTTTGAAGG TAATGGTCAG ACTTTTCGTA TCCTCACCAA GCTTGAACCC 
TACACGCCCG GCTTTGGGAT GAATCTGTGC CGGCGCACTC TGCTTGGCAT TTTGAAGTAC 
CCACAACTTG CCGCCGAACT TAAATCCAGC GCGCCCCATG TTGAAGTTGC CCATTATCGG 
CAGCTGCGCC CCGCCGACTG GCCGCCCATA AAAGCCGTAT TCGGCGAAGA TGCCGATATG 
CTCAATTGGG TACTTTCGCC ACTGTCTCGG TCAGACAGGG CGCTGTTCAG CCAATTTACA 
CCGGCAGAAG GTCGTCGCCA CGGCCGCACA CTTTTCAAGT CGCTGGATGC CACCATCATG 
GAGCTCGCCG ACGATATCGC CTATGCGGTG CACGATCTGG AAGATGCCAT AGTGATGGGC 
ATTGTCAGCC GGGAGCAGTG GCTCGATGGT GTTGCGCCAC TGCTTAAAGA GAGCGGTGAC 
AGCTGGATAA AGGGCGAACT TGGCGCCATA GATGCACACC TATTCGCCCC TGAGCATCAT 
CTTCGTAAAG ATGCCATCGG CACCCTGGTA AACGGATTTG TCACTGCCAT TGCCATGGTG 
GAGGATGAGC GCTTTGACGA GCCGCTGCTG CGCCACAATG CAGTACTGGA AGAGGAGTTT 
GCTCTGGCGC TGAATGCACT CAAGCGTTTT GTGTGGCGTT ATGTGGTGAG AAAACCCGAA 
GTACAAATGC TCGAGTACAA GGGGCAGCAA ATGGTGATGC AACTGTTTGA AGCCTTTGCG 
TCGGATCCAG AGCGGCTACT GCCACTCAAT ACCCAGGGGC GCTGGCGCGA AGCGTCCGAC 
AATGGTGAGA ATGCCATGCG GGTAATTGCC GATTATATAT CAGGAATGAC CGATGAATTT 
GCCATTCGTA TGCACCATCA ACTTTTCAGC CCCCGCCTTG GCGGCCTGAG CGATCTGGGT 
CAGGATTTTT AA

Protein sequence

MYNPWHERRH GEEKHRRNDH RSPFQRDRAR VLHSAAFRRL QAKTQVLGVG MNDFYRTRLT 
HSLEVSQIGT GIAAQLKRKH PDKESLIDSM SLIESLCLAH DIGHPPFGHG GEVALNYMMR 
DHGGFEGNGQ TFRILTKLEP YTPGFGMNLC RRTLLGILKY PQLAAELKSS APHVEVAHYR 
QLRPADWPPI KAVFGEDADM LNWVLSPLSR SDRALFSQFT PAEGRRHGRT LFKSLDATIM 
ELADDIAYAV HDLEDAIVMG IVSREQWLDG VAPLLKESGD SWIKGELGAI DAHLFAPEHH 
LRKDAIGTLV NGFVTAIAMV EDERFDEPLL RHNAVLEEEF ALALNALKRF VWRYVVRKPE 
VQMLEYKGQQ MVMQLFEAFA SDPERLLPLN TQGRWREASD NGENAMRVIA DYISGMTDEF 
AIRMHHQLFS PRLGGLSDLG QDF