Gene Vapar_3869 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_3869
Symbol
ID	7969726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	-
Start bp	4098385
End bp	4099398
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	65%
IMG OID	644794455
Product	NMT1/THI5 like domain protein
Protein accession	YP_002945749
Protein GI	239816839
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.478553
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCTT CTTTCTCACG CCCCGTATCG CGCCGGGGTG TCCTGCGCGG AGGCGCCGCC 
GCTGCCGTGG TCGCCTCTGG CGGCCTGATC GCCTCGCAGG CCTTCTCGCA GCAGGCGCGC 
AAGCTCACCT TTGCATGGAA CGCCGCCGCG TTCTGCCTCT CGCCCGTCGT CGTCGCGCAG 
GAGCGCGGCT ACTTCGAGCG CAACGGCCTG CAGGTGGACC TGATCAACTA CACCGGTTCC 
ACCGACCAGC TGCTGGAGTC GCTGGCCACG GCCAAGGCCG ATGCGGCGGT GGGCATGATC 
CACCGCTGGC TCAAGCCGCT GGAGTCGGGC TTCGACGTGA AGATCGTCGG CAGCTCGCAC 
GGCGGCTGCG TGCGGCTGGT GGGTGCGAAG AGTGCGGGCG CGACCAGCCT TGCGAGCCTC 
AAGGGCAAGA TCATCGGCGT GTCGGACATC GCGAGCCCCG GCAAGAACTT CTTCTCGATC 
CTGCTCGCGA AGAACGGCAT CGATGCCGAC AGGGACGTGA CCTGGCGCCA GTACCCGGCC 
GACCTGCTCG ACATTGCGGT GCAGAAAGGC GAGATCCACG CCATTGCCGA TGGCGACCCG 
AACGTTTACC TGATCGAAAA GCGCAACAAG GACGCCTTCG TGGAGATTGC GAGCAACCTC 
TCGGGCGAAT ACAAGGACAA GGTCTGCTGC ATCGTCGGCG CGCGCGGCGA ACTCGTTCGC 
AAGGACAAGC CGACCGTCGC GGCCCTCGTG CGCGCCATCG CGCAAGCCTC CGACTACGTG 
GCCGAGAACC CGAACGAATC GGCCAAGCTG TTTGCGAAGT ATTCGCCCAA GGTGCCGGTC 
GAAGACCTGC GCGCGCTGCT TGGCACGCTC ACGCACAACC ACCATCCGCT CGGCAGGAAC 
CTGCGCGACG AGGTGGAGTT CTATGCGCGA GATTTCCGCG GCGTTGGCGT GCTCAAGAAG 
ACCACCGATC CGGTGCGCTT TGCCGAGCAC GTCTCTTTCG ATCCACTCGC ATGA

Protein sequence

MTASFSRPVS RRGVLRGGAA AAVVASGGLI ASQAFSQQAR KLTFAWNAAA FCLSPVVVAQ 
ERGYFERNGL QVDLINYTGS TDQLLESLAT AKADAAVGMI HRWLKPLESG FDVKIVGSSH 
GGCVRLVGAK SAGATSLASL KGKIIGVSDI ASPGKNFFSI LLAKNGIDAD RDVTWRQYPA 
DLLDIAVQKG EIHAIADGDP NVYLIEKRNK DAFVEIASNL SGEYKDKVCC IVGARGELVR 
KDKPTVAALV RAIAQASDYV AENPNESAKL FAKYSPKVPV EDLRALLGTL THNHHPLGRN 
LRDEVEFYAR DFRGVGVLKK TTDPVRFAEH VSFDPLA