Gene Vapar_6086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_6086
Symbol
ID	7975532
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012792
Strand	+
Start bp	804261
End bp	805601
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	68%
IMG OID	644796642
Product	HipA N-terminal domain protein
Protein accession	YP_002947916
Protein GI	239820731
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCGCA CACGGGGCCT GCAGGCCCTT TCCATCTGGG CCAACGGTGA ACGGGTCGGC 
AGCTGGCGCA TTCCCGCGCA CGGGGCGGAC GAACTGCGCT ATGACGATGC CTGGGCCGAT 
TCGCCCGCCG GGCGCCCGCT CTCGCTTTCG TTGCCGCTGG TGCGCGGCTT CACCCACAAG 
GGCGCGGTCG TCAGCAACTA CTTCGACAAC CTGCTGCCGG ACAGCCTGCC CATACGCCAG 
CGCATCGCGA GCCGCTTCGG CACGCAGACG ACGCAGGCCT TCGACCTGCT GCAGGCGATC 
GGCAGGGATT GCGTGGGCGC CATCCAGCTG CTGGGAGAGA ACGCCAGCCC GGCCGATGTG 
GAACGCATCG AGGGCGAACC GATGAGCGAA GCCGGCGTCG AGCGGCTGCT GCTGCAGACG 
GTCGATCCGG GCAGGTTCGC CGCGCAGGCC GTGCCTGGCG ACGAACTGCG CATCTCGCTG 
GCCGGCGCCC AGGAGAAAAC CGCGCTTCTG TGGCACGAGG GCCAGTGGCT GCGCCCGCAG 
GGCTCGACCC CCACCACGCA TATCCTGAAG CTGCCCTTGG GCCTGGTCGG CCATCGCAAG 
GCCGACTTCA GCACCTCGGT GGAGAACGAG TGGCTCTGCC TGAACATCCT CCAGGCGTAC 
GGCCTTCCCG TGCCCCGCAC CGCGATGCTC CGGTTCGGTT CGCAGAAGGT GCTGGCCGTC 
GAGCGCTTCG ACCGCCGGCT GCACTCCTCC GGAAACTGGT GGCTGCGCCT GCCGCAGGAA 
GACTTCTGCC AGGCCCTCGG CAAGCCGTCG CACCTGAAAT ACGAAGCGGA CGGCGGACCG 
GGAATGACCG ACCTCGCCGA CGTGCTGCGC AACTCAGTCA ACGCCCAGGA AGACCTGGCA 
ACGCTCCTCA CCGCGCAGCT GCTCTTCTGG ATGCTGGGCG CGCCCGACGG GCATGCCAAG 
AACTTCAGCA TCGCCTGGCT CCCGATGGGC CGCTACAGGC TGACGCCCCT CTACGACGTG 
ATGTCCATCT GGCCCCTGGA AGGCAACGGC CCGAACCAGT TTTCCAGGCA CGAGGCCAAG 
CTCGCGATGG CCTTGTCCGG CAAGAGCAGG CACTACCACT TCAAGACCAT CCAGCGGCGC 
CACTTCAACG CCATGGCACA GAAGTGCCAC TACGACCCGG ATGCCGAGAA CATCATCCAG 
CGCGTGCTGG CGGCAACGCC CGGCGTGATC GATCGGATCG CCGCGCGCCT GCCCGCGCAG 
TTTCCGGTAG CGGTGTCGGG CCGGATCCTC GAAGGGCTCG CCCGCTCCGC GAGGGCGCTG 
AAGGGAATGC CGCCCGTCTA G

Protein sequence

MARTRGLQAL SIWANGERVG SWRIPAHGAD ELRYDDAWAD SPAGRPLSLS LPLVRGFTHK 
GAVVSNYFDN LLPDSLPIRQ RIASRFGTQT TQAFDLLQAI GRDCVGAIQL LGENASPADV 
ERIEGEPMSE AGVERLLLQT VDPGRFAAQA VPGDELRISL AGAQEKTALL WHEGQWLRPQ 
GSTPTTHILK LPLGLVGHRK ADFSTSVENE WLCLNILQAY GLPVPRTAML RFGSQKVLAV 
ERFDRRLHSS GNWWLRLPQE DFCQALGKPS HLKYEADGGP GMTDLADVLR NSVNAQEDLA 
TLLTAQLLFW MLGAPDGHAK NFSIAWLPMG RYRLTPLYDV MSIWPLEGNG PNQFSRHEAK 
LAMALSGKSR HYHFKTIQRR HFNAMAQKCH YDPDAENIIQ RVLAATPGVI DRIAARLPAQ 
FPVAVSGRIL EGLARSARAL KGMPPV