Gene Shewana3_2147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Shewana3_2147
Symbol
ID	4478343
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella sp. ANA-3
Kingdom	Bacteria
Replicon accession	NC_008577
Strand	+
Start bp	2571878
End bp	2573218
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	51%
IMG OID	639726735
Product	deoxyguanosinetriphosphate triphosphohydrolase-like protein
Protein accession	YP_869783
Protein GI	117920591
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000342411
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0447313
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTCAA GTGTTTGGCA AGAACGCCGC CATGGCGAAG ATAAACAAAG ACGTAATGAT 
CATCGAAGCC CTTTCCAAAG GGACAGAGCA AGGATCCTCC ACTCCGCAGC TTTTCGCCGC 
CTACAGGCCA AAACCCAAGT GCTTGGGGTA GGCATGAACG ATTTTTATCG CACGCGCTTA 
ACCCATTCAC TCGAAGTGTC TCAAATCGGC ACTGGCATTG CGGCGCAGCT CAGCCGCAAG 
TATCCCGAGC ATAAGCCCTT ATTAGGCTCG ATGAGCCTGC TCGAATCCCT CTGTCTAGCC 
CATGATATTG GCCATCCGCC CTTTGGTCAT GGCGGTGAAG TCGCACTCAA CTATATGATG 
CGCCACCACG GCGGCTTTGA AGGCAATGGC CAGACGTTTC GTATCCTCTC GAAACTCGAG 
CCTTACACCG AGGCCTTTGG GATGAATCTG TGCCGCCGTA CTATGCTCGG CATTTTAAAA 
TATCCCGCAT CGCAATCACT GCTGTTTGTG GCAGGTTCGC ATCCTGAAAT CACCAATCAC 
AGACAGCTTA AACCATCACA ATGGCCGCCT GTTAAAGGCA TATTCGACGA TGATAGCGAC 
ATTTTCGATT GGGTACTGGA ACCGTTGTCC GTTGCCGATA GAGCGCGCTT TACCTCCGTT 
CAACCGAGCC TACAGCCAAA CTACCCGCAT CTACGCACTC AGTTTAAATC CTTCGATTGC 
TCGATAATGG AACTGGCGGA CGACATCGCC TACGCGGTGC ACGATCTTGA AGATGCGATT 
GTCATGGGCA TAGTCACCGC CTCGCAATGG CAACAGGATG TGGCGCCGAC ACTTAAGCAC 
AGTGGCGATC CTTGGATCCG CCAAGAGCTT GCCGATATCG GCACTAAGCT CTTCTCCCAC 
GAACATCATC TGCGAAAGGA TGCCATCGGT ACCTTAGTAA ATGGTTTTGT CACCGCCATT 
ATTATCAACG ACGATCCGGC TTTCGAGGAA CCGTTGCTGC GGTTTAATGC CAGCCTAGAA 
CCCGAATTTG CTAATGCGCT CAATGTGCTA AAGCAGTTAG TGTTTAAATA CGTTATCCGT 
AAACCTGAGA TCCAAATGCT GGAATACAAG GGCCAACAGA TAGTGATGGG ACTCTTCGAA 
GCGTTCGCCT CGGATCCCGA GCGGTTATTA CCACTCAATA CCCAAGAACG TTGGCGCACC 
AGTGAGCAGC AAGGTCAAAA CAGCCACAGG GTGTTGGCAG ATTATATTTC TGGCATGACG 
GATGAATTTG CCGGAAGACT GTACCAGCAG TTATTTAGCC CCAAGGCCGG CTCGAACGTG 
GAACTCAGCA AAGAGATGTA G

Protein sequence

MSSSVWQERR HGEDKQRRND HRSPFQRDRA RILHSAAFRR LQAKTQVLGV GMNDFYRTRL 
THSLEVSQIG TGIAAQLSRK YPEHKPLLGS MSLLESLCLA HDIGHPPFGH GGEVALNYMM 
RHHGGFEGNG QTFRILSKLE PYTEAFGMNL CRRTMLGILK YPASQSLLFV AGSHPEITNH 
RQLKPSQWPP VKGIFDDDSD IFDWVLEPLS VADRARFTSV QPSLQPNYPH LRTQFKSFDC 
SIMELADDIA YAVHDLEDAI VMGIVTASQW QQDVAPTLKH SGDPWIRQEL ADIGTKLFSH 
EHHLRKDAIG TLVNGFVTAI IINDDPAFEE PLLRFNASLE PEFANALNVL KQLVFKYVIR 
KPEIQMLEYK GQQIVMGLFE AFASDPERLL PLNTQERWRT SEQQGQNSHR VLADYISGMT 
DEFAGRLYQQ LFSPKAGSNV ELSKEM