Gene Avin_18960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Avin_18960
Symbol
ID	7760830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Azotobacter vinelandii DJ
Kingdom	Bacteria
Replicon accession	NC_012560
Strand	-
Start bp	1886349
End bp	1887755
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	67%
IMG OID	643804794
Product	deoxyguanosinetriphosphate triphosphohydrolase-like protein
Protein accession	YP_002799083
Protein GI	226944010
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCTGGC AGTCGTGCGG CGATCCGGGC GCCGCCCTCC CGCAGCGGCT GCCCACCGAA 
CGACGAGGAA CGGCTTTGGA CTGGCAAACC CTACTGACCC GAGAACGCCT GGGCAAATCG 
GTGCACAGCG TCGATGAACT GGGCCGCAGC CCTTTCCACA AGGACCACGA CCGCATCATC 
TTTTCCGGCG CCTTCCGCCG CCTGGGCCGC AAGACCCAAG TGCATCCGGT GTCCAGCAAC 
GACCATATCC ACACCCGCCT GACCCACTCC CTGGAAGTCA GTTGCGTCGG CCGCTCGCTG 
GGCATGCGGG TCGGCGAGGT GCTGCGCGAC ACCCTGCCGG AATGGTGCGG CCCCGCCGAC 
CTCGGCATGG TCGTCCAGTC GGCCTGCCTG GCTCACGACA TCGGCAACCC GCCGTTCGGC 
CATTCCGGCG AGGATGCCAT CCGCCACTGG TTCCACCAGG CCGCCGGACG CGGCTGGCTG 
GACGGCATGA GCGACGCGGA ACGCGACGAC TTCCTGCATT TCGAGGGCAA CGCCCAGGGC 
TTTCGCGTAC TCACCCAACT GGAATACCAC CAGTTCGACG GCGGCACCCG CCTGACCTAC 
GCCACCCTCG GCGCCTACCT CAAATACCCC TGGGCATCGC GCTACGCACA GGCTCCGGGC 
TACAAGAAGC ACAAGTTCGG CTGCTACCAG AGCGAACTGC CGCTGCTCGA ACAGATCGCC 
GAGAAGCTCG GCCTGCCCAG GCAGGGCGAG CAGCGCTGGG CGCGTCATCC GCTGGTCTAT 
CTGATGGAGG CGGCGGACGA CATCTGCTAC GCGCTGATCG ACCTGGAAGA CGGCCTGGAA 
ATGGAGCTTT TGGACTACTC CGAGGTCGAG GCCCTGCTGC TCGGCCTGGT CGGCGACGAC 
CTGCCGGAAT CCTACCGCCA GCTCGGTCCG CGCGACTCGC GGCGGCGCAA ACTGGCGATC 
CTGCGCGGCA AGGCCATCGA ACACCTGACC AACGCGGCGG CCCGCGCTTT CGTCGAGCAG 
CAGAAGGCCC TGCTCGAGGG CAGCCTGGCC GGCGACCTGG TCGAACACAT GCACGGACCG 
GCCAAGGATT GCGTGCTGCA GGCCAAGCAT GTCGCCCGCG AGAAGATCTT CCACGACAAG 
CGCAAGACCC TCCACGAGAT CGGCGCCTAC ACCACCCTGG AGATCCTGCT CGACGCCTTC 
TGCGGCGCGG CGCTGGAGCA GCACGGCGGC AGGCGGATAT CGTTCAAGAA CCGGCGCATC 
CTCGACCTGC TCGGCAACAA CGCACCGGAC CCGCAGTGGC CGCTGTACCA CGCCTTCCTG 
CGCACGATCG ACTTCATCGC CGGCATGACC GACGGTTACG CCACCGAGAT GGCCCGGCAA 
ATGACCGGCC TCTCCGGTCC CGCGTAG

Protein sequence

MRWQSCGDPG AALPQRLPTE RRGTALDWQT LLTRERLGKS VHSVDELGRS PFHKDHDRII 
FSGAFRRLGR KTQVHPVSSN DHIHTRLTHS LEVSCVGRSL GMRVGEVLRD TLPEWCGPAD 
LGMVVQSACL AHDIGNPPFG HSGEDAIRHW FHQAAGRGWL DGMSDAERDD FLHFEGNAQG 
FRVLTQLEYH QFDGGTRLTY ATLGAYLKYP WASRYAQAPG YKKHKFGCYQ SELPLLEQIA 
EKLGLPRQGE QRWARHPLVY LMEAADDICY ALIDLEDGLE MELLDYSEVE ALLLGLVGDD 
LPESYRQLGP RDSRRRKLAI LRGKAIEHLT NAAARAFVEQ QKALLEGSLA GDLVEHMHGP 
AKDCVLQAKH VAREKIFHDK RKTLHEIGAY TTLEILLDAF CGAALEQHGG RRISFKNRRI 
LDLLGNNAPD PQWPLYHAFL RTIDFIAGMT DGYATEMARQ MTGLSGPA