Gene Vapar_5917 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_5917
Symbol
ID	7974956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012792
Strand	+
Start bp	621834
End bp	623171
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	65%
IMG OID	644796485
Product	HipA N-terminal domain protein
Protein accession	YP_002947759
Protein GI	239820574
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.902916
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCCGTC GGTCACACAG CCAGTCCCTC GGCCTCTGGT CCAACGGTGA ACGCGTCGGC 
CGCTGGACAA TCCCTGCCCG CGGCGACATG GAGCTTCACT ACGACGACGC CTGGGTTCGA 
TCGGACGTCG GTCGCCCGCT TTCCCTGTCC CTGCCCTTCA ACCCGCACAA CGAGCCCATC 
AAGGGCGCCG CCGTCGAACA CTACTTCGAC AACCTGTTGC CCGAGAGCAA TGCCATTCGC 
AAGCGCGTGG CGGCGCGCTT CAAGACCGGC TCGGTAGACG CCTTCCCTCT TCTGCGCGCT 
ATCGGGCGCG ACTGCGTGGG CGCCGTTCAG CTTCTCGACG AGGCCCAGAC ACCCACGGCC 
ACCGATCAGG TGGAAGCGGT GCAGGTCGAT GACGAGTCCA TCGAGCGGCA CCTGCTGAGC 
GTCGTCAGTC CCGACAAGTT CGGCGCTTCT GAGGACCCGG ACGACGACTT CCGCATTTCC 
CTGGCCGGCG CGCAGGAAAA GGATGCCTAT CTGTGGTGGA ACGGCGCCTG GCACAAGCCG 
CGGGGCGCCA CCCCCACCAC GCACATTTTC AAGCTCCCGT TGGGCCTGAT CGGCGGCGTC 
CGGGCCGACT TCTCCACCTC GGTGGACAAC GAGTGGCTGT GCTTGAAGCT GCTACACGCC 
TACGGGCTCT CCACGGCAGA CGCCACCATC ACCTCGTTCG GGAAACAGCG CGTCCTCGTC 
GTCGAACGCT TTGACAGGCG CATTTCGAAC GGCCGCCTCC TGCGGCTGCC CCAGGAAGAC 
TTCTGCCAGG CGACGGGGAC GTCGCCGCTC ATGAAGTACG AGAGCGAAGG CGGACCCGGC 
CTGCGCAAGC TCTTTGCACT GCTGCAGCAG TCCGCGACCG CGGCGGATGA CATGCGCACC 
TTGATGGCCT CGCAGGTCCT GTTCTGGCTG CTGCGCGCGC CGGATGGACA TGCGAAGAAC 
TTCAGCATTC ATCTGCTGGC CGGCGGCGGC TTCCGGCTGA CGAAGATGTA TGACGTGATG 
TCGGCCTATC CCATCCTCGG CAAGGGCCCC AACCAGTGGG CGCCACGCGA GGTCAAGATG 
GCCATGGCGC TTCTCGGGAA GAGCAAGCAC TACACCATGG CCGCCATCCA GCGCCGGCAC 
TTCAACAGCA CCGCCCGACA GGTAGGCTAT GCGCACGACG CCGAAGCCAT CATCCAGCAG 
CTGATTGAAC GCACGCCCCG CGCAATCAGC GAAGTGCAGG CGCAGTTGCC GAAGGATTTC 
TCGCCATGGG TCGCCGAGCG TGTGCTGGGC GGGCTGCAGG CCGCGGTGGA CACGCTTGAA 
GGGATGCCAT CCAACTGA

Protein sequence

MGRRSHSQSL GLWSNGERVG RWTIPARGDM ELHYDDAWVR SDVGRPLSLS LPFNPHNEPI 
KGAAVEHYFD NLLPESNAIR KRVAARFKTG SVDAFPLLRA IGRDCVGAVQ LLDEAQTPTA 
TDQVEAVQVD DESIERHLLS VVSPDKFGAS EDPDDDFRIS LAGAQEKDAY LWWNGAWHKP 
RGATPTTHIF KLPLGLIGGV RADFSTSVDN EWLCLKLLHA YGLSTADATI TSFGKQRVLV 
VERFDRRISN GRLLRLPQED FCQATGTSPL MKYESEGGPG LRKLFALLQQ SATAADDMRT 
LMASQVLFWL LRAPDGHAKN FSIHLLAGGG FRLTKMYDVM SAYPILGKGP NQWAPREVKM 
AMALLGKSKH YTMAAIQRRH FNSTARQVGY AHDAEAIIQQ LIERTPRAIS EVQAQLPKDF 
SPWVAERVLG GLQAAVDTLE GMPSN