Gene Vapar_1901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_1901
Symbol
ID	7971080
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	-
Start bp	2032452
End bp	2033513
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	67%
IMG OID	644792502
Product	NMT1/THI5 like domain protein
Protein accession	YP_002943816
Protein GI	239814906
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCCATCG AGACGCCCTC CTCTTCCCAT GCCAGCGCCC CGCCTTCGAG GCGCCTGGCG 
CTCAAGACCT TCGCTTCGCT CGCCTCCGTG GCGGCCATCG GCAGCCTCGG GCTTTCGGGC 
TGCTCGCGCG AGGCCGGCGG CCCGGCCGTG GTGAAGAAGA CCGGCGACAA GGTGGCGTTC 
AAGTACCCGA ACAACCCGTC GTTCGACCTG ATCTACCTGG CCGACGAGCT CGGCTACTTC 
GACGGCACCA ACACCCGCCC CGAGTACGTC GGCAAGATCG CCGCGCCGCA GATCATTCCG 
CTGGTGGGCA CGGGCGAGAT CGACTTCGGC AGCCGCATGG TGCCGCTGGT GATCTCGGCC 
ATTGCGTCGG GCGCGGACCT CAAGGTGGTG GCCGCGGGCG GCAAGACGCT GCAGGAGGCG 
CCGCACATGA AGTACTTCGT TCGCAAGGAC TCGGGCATCC GCAACCCGAA GGACCTGGAG 
GGCAAGACCA TCGGCTTCAA CAGCTTCGGC GCCTGCGCCG AGTTCGTGAC CAAGAAGTAC 
CTGCGCCAGC ACGGCGTGGA CGTGGCGAAG ATCAACTTCG TCGTGGTGCC CGACGAGCAG 
GCCGAGCAGA CGCTGGTGAC CGGCAACACC GACCTCGCGA TCATCCACGC GCCTTTCTCG 
GGCCGGGCCG ACAACGCCGA GCCCCTGGTG CGGCTGTGGA GCGACTACGA CCTCGACGGC 
GGCCTTGGCG GCATGGCGCC GTACAGCGCG CATGGCCAGT TCATCCGCCA GCACCCGGAG 
GCAGTGCGCG ACGTGGTGGC GGCGCTCGCC AAGGCCGGCA ACTGGGTCAA TGCCAACACC 
GAGGAAGCGC GCAAGCTGGT GGCCAAGCGC ATCAGCATGG ACCTGAAGAA CGTCGACCGC 
TACGCCTATG TCGACGACCT GGTGGTGACC GAGCCGCCGA TCCAGTACTA CATCGACATC 
CTGCAGTCCG AGGGCAAGCT CGCCGCCGGC AAGGTGGCGG TGAAGGACGT CTACACGAAC 
GAGTTCAATC CCTTCGCGCA GCAGCAGGCC GCGAAGTCCT GA

Protein sequence

MPIETPSSSH ASAPPSRRLA LKTFASLASV AAIGSLGLSG CSREAGGPAV VKKTGDKVAF 
KYPNNPSFDL IYLADELGYF DGTNTRPEYV GKIAAPQIIP LVGTGEIDFG SRMVPLVISA 
IASGADLKVV AAGGKTLQEA PHMKYFVRKD SGIRNPKDLE GKTIGFNSFG ACAEFVTKKY 
LRQHGVDVAK INFVVVPDEQ AEQTLVTGNT DLAIIHAPFS GRADNAEPLV RLWSDYDLDG 
GLGGMAPYSA HGQFIRQHPE AVRDVVAALA KAGNWVNANT EEARKLVAKR ISMDLKNVDR 
YAYVDDLVVT EPPIQYYIDI LQSEGKLAAG KVAVKDVYTN EFNPFAQQQA AKS