Gene Vapar_5141 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_5141
Symbol
ID	7971512
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	-
Start bp	5454763
End bp	5455962
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	71%
IMG OID	644795735
Product	Amidohydrolase 3
Protein accession	YP_002947009
Protein GI	239818099
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACTCG AGTCGCTGCG CATTCCGTCG CGGCTGCGCG GCTTTGCCGC GGGCGATGCC 
CAGGTCTTCG ACGTCACGCT GGCCGGCGAC AGGGTGCAGG CCGTCGCGCC GAGCGCATCG 
CAGTCGCAGG CGCGCGGCAC CTTGCTGAGC GCGCTCGTCG AGGCGCATGC GCACATCGAC 
AAGAACTACA CCGTGCAGGA AGTCGGCGCG GCCGAGGGCA ACCTGTTCGC GGCCATCGAC 
CGCATGGCGA AGCACCGCGC GGGCTGGAGC GGCCAAACGC TGCGCCCGCG CATGGAGCGC 
GCGCTGCACG AGGCCTGGCA GTCGGGCACG CGCGCGCTGC GCACCCACAT CGACTGGGTG 
GAGGGCGAGC CGCCCGCCGC GCTGGCGGTG TTCGAGGCGC TGCGCGAAGA GTGGCGCGGC 
CGCATCGAGC TGCAGTTCGT CTCTCTCACG CCGCTCGACC TGTTCGCGGA CCTCGCGGCC 
GGCGAGCGCA TTGCGCGCGA GGTGAAGCGC GCGGGCGGCG TGCTGGGCGC CTTCGTGTAT 
CGCAACGAAG GCCTGGTGCA CAAGCTGGGC CGCGTGTTCG ACCTCGCGCA GGACCACGGC 
CTGGGCCTCG ACTTCCATGT CGACGAAGGG CTCGACGCCG ATGCGAGCGG CCTGCGCAGC 
ATTGCGCAGC TGATGCGTGC GCGCGACTTC CGGCGCGGCG TGGTCTGCGG CCACTGCTGC 
TCGCTGGCGA TGCAGGACGA TGCCGTTGCC AACGAAACGC TGGCGCTGTG CGCGGGCGCC 
GGCATCCACA TCGTCGCGCT GCCGACCACC AACCTCTACC TGCAGGGCGC CTGGGACCGC 
ACGCCCGTGC CGCGCGGCAT CACGCGCATC CACGAGGCGG CGGCACGGGG CTTGCGTGCG 
AGCCTGGCCA CGGACAACGT GCAGGACGCC TTCTATCCCT ATGGCAGCTA CGACCTTCTC 
GAAACCTTCG GCCTCGGTGT GCAGATGGCG CACCTCGCGC CCGCGGAAGA ATGGCTCGAC 
GCGATCACCG TCAGCCCCGC GAAGGCGCTC GGCCTGGCAT GGGACGGCCG CATTGCGCCG 
GGCTGCCCCG CGGACCTGGT GCTGCTCGCG GCCACCGGCG AGCATGAGCT GGTCGGCCCG 
CGCGGGCGCC GACGCACCGT GATCCGTGGC GGTCAAGAAA TTCTGGAGCA GACACGATGA

Protein sequence

MKLESLRIPS RLRGFAAGDA QVFDVTLAGD RVQAVAPSAS QSQARGTLLS ALVEAHAHID 
KNYTVQEVGA AEGNLFAAID RMAKHRAGWS GQTLRPRMER ALHEAWQSGT RALRTHIDWV 
EGEPPAALAV FEALREEWRG RIELQFVSLT PLDLFADLAA GERIAREVKR AGGVLGAFVY 
RNEGLVHKLG RVFDLAQDHG LGLDFHVDEG LDADASGLRS IAQLMRARDF RRGVVCGHCC 
SLAMQDDAVA NETLALCAGA GIHIVALPTT NLYLQGAWDR TPVPRGITRI HEAAARGLRA 
SLATDNVQDA FYPYGSYDLL ETFGLGVQMA HLAPAEEWLD AITVSPAKAL GLAWDGRIAP 
GCPADLVLLA ATGEHELVGP RGRRRTVIRG GQEILEQTR