Gene Vapar_1147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_1147
Symbol
ID	7973316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	1260116
End bp	1261246
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	68%
IMG OID	644791743
Product	deoxyguanosinetriphosphate triphosphohydrolase-like protein
Protein accession	YP_002943064
Protein GI	239814154
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTCG CGGCCTATGC CTGCCACCCC GCGCGCTCGC GCGGAAGGCG CCATGCCGAG 
CCGCCGGCGC CCACGCGCGA CGCCTTCCAG CGCGACCGCG ACCGCATCGT GCATTCCACC 
GCGTTCCGGC GGCTGGTCTA CAAGACGCAG GTCTTCCTGA ACCACGAAGG CGACCTGTTC 
CGGACCCGGC TCACGCATTC GCTCGAAGTC GCGCAGCTGG GCCGCTCCAT CGCGCGGGCC 
CTGCGCATCA ACGAAGACCT GGTCGAAGCG ATTGCCCTTG CGCACGACCT CGGCCACACG 
CCGTTCGGCC ATGCGGGCCA GGACGCGCTC AACGCCTGCA TGGAAGGCCA CGGCGGCTTC 
GAGCACAACC TGCAGAGCCT GCGCGTGGTC GATGCGCTTG AGCACCGCTA TCCGCAGTAC 
GACGGCCTGA ATCTCAGCTT CGAGACCCGC GAAGGCATCC TCAAGCACTG CTCGCGCGCC 
AATGCCGAGC GCCTGGAGGC GGGTGAACCC CACGGCGTGG CGCGCCGCTT CCTCGACCGC 
ACGCAGCCGG GCCTCGAGGC GCAGCTTTGC AACCTGGCCG ACGCCATCGC CTACAACGCG 
CACGACATCG ACGACGGCGT GCGCTCCGGC CTCATCAACG TCGAGCAGCT CGGCGAGGTG 
GAGCTGTTCG AGCGCTACCG CCGCGAAGCG CTGGCCGAAT ACCCGCAGCT GGAAGGGCGG 
CGCGTGCTCT ACGAAACCAT CCGGCGCATG CTGAGCGCGC AGGTCTACGA CGTGATCGAC 
GCCACGCGTG CGGCACTCGA AACAGCGAAG CCGGCCGATG CCGATGGTGT GCGCAAGGCG 
CCGCCGCTCG TTGCGTTCAG CGAAACCATG CAGGCGCAAT CGAACGAGCT CAAGGCCTTC 
CTGTTCCGCA ACCTCTATCG CCATCTGCAA GTGAGGCAGA CCACCGACCA GGCACAGCAG 
GTGGTGCGGG AACTGTTCGA GGCCTATCTG GCGCGCGGCG CCGAGATGCC TGTTTCCTAC 
GCAGACCGGC GCGACCGGCA TCGCGCCGTC GCCGACTACA TCGCCGGCAT GACCGACCGC 
TTCGCCATGC GCGAGCATGA ACGGCTGACC GGCCGGCGGG GGATTGCATG A

Protein sequence

MSLAAYACHP ARSRGRRHAE PPAPTRDAFQ RDRDRIVHST AFRRLVYKTQ VFLNHEGDLF 
RTRLTHSLEV AQLGRSIARA LRINEDLVEA IALAHDLGHT PFGHAGQDAL NACMEGHGGF 
EHNLQSLRVV DALEHRYPQY DGLNLSFETR EGILKHCSRA NAERLEAGEP HGVARRFLDR 
TQPGLEAQLC NLADAIAYNA HDIDDGVRSG LINVEQLGEV ELFERYRREA LAEYPQLEGR 
RVLYETIRRM LSAQVYDVID ATRAALETAK PADADGVRKA PPLVAFSETM QAQSNELKAF 
LFRNLYRHLQ VRQTTDQAQQ VVRELFEAYL ARGAEMPVSY ADRRDRHRAV ADYIAGMTDR 
FAMREHERLT GRRGIA