Gene Vapar_5936 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_5936
Symbol
ID	7974975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012792
Strand	-
Start bp	637656
End bp	639026
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	63%
IMG OID	644796500
Product	HipA N-terminal domain protein
Protein accession	YP_002947774
Protein GI	239820589
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.647866
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGGGT CTGAGGACAA CGTGTATCGC TTGCGCGTGA CGCACGATGG TGGCACCCCG 
GTCGGCGAAC TCGCCTACTC AAGAGCGGAA GACCGGTGGT CGTTCCGTTA TGACCACGCA 
TGGGCGCGCC AGGGTGCCTT TCAACTCTCG CCGGCGTTTC CCTTGGAGCC GCCACCGGAC 
GGCTATGACT CTCATGCGAT CCGACGCTTC ATCGTGAACC TCTTTCCGGA GGGGGCGCCT 
CTTCGCGCCG CGCTCGAGCA ACTCCACGTC GCACCGAGCA ACGCATTTGC ACTGCTGCGG 
GAAATGGGAG GGGAGACGAC CGGGGCCCTG GAGTTCCAGC CCTTCGATCA ACCACCGGCT 
GCGGCCGCTC GTCGAGAACA ACGCTTTCTG TCGCGAGAGG AGCTCAGCGG CCGTATCGAT 
GCTGCAAAGG AAGGCGGCCT CACGGTGTGG GACGGCCGGG TGCGAATGTC GATTGCGGGC 
TATCAGGACA AGCTGGCCGT ATGGGCTGCG CACGACCTCG TCCATGACAC AGAGGCCAGC 
ATGTGGCTGC CGGAGCCGCC ACTGGCCTCG ACTTTTATTC TCAAGCCGCA GCCGGCCGGC 
CCACGTACAC CTCACCTCGT GGCCAACGAG CACTACTGCA TGACGCTCGC AGGGGCGTAT 
GGCGCTCAGG TGGCCCGTGT TGCCATCATG CGGCTGAGGG TTCCGGTTCT GGTCGTCGCC 
CGGTTCGACC GGCAATGGCG CGCCGAAGAA AACCACGATT GGGTGACAAA GCTGCACGTC 
ATCGACGCCT GCCAGGCTGC CGATCTTTCG GTGGATTCCA AATATGAGCG CCATCTGGGC 
AATTCCCCCG CCCTCGCACC ATATCGCGAT GGGATGAGTC TGCCGCGACT TTTTGGTCTT 
GCCGCTCTCA TGCGCCGCCC GGCGGTGGCG CGGTTGGAGA TGTTGCGTTG GGCACTGTTC 
CAGCTGGCGG TCGGCAACTC CGATGCGCAT GGAAAGAACT TTTCATTCTT CGTCGACCGA 
ACCATGCTTG AGCCCGCGCC GTGGTATGAC GTCGTGAGCG TGGCTCAATA TCCGGAACTC 
GACCAAAGCT TCGCAATGTC CTTCGGCGAT GCCTTCGGAT GGGAAGAACT CAACGCGATG 
GAGCTTGCGC ATTTCGCCCA CCTATGCGGC ATCGATCAAA AGCTGTTGCA CCGGGAGACC 
GAGCGGCTGT CCCGTGCGAT GAAGAGAGCA CCCGAACTTC TTTCCGCCCC GGTGTACACC 
GAAGAGGAGC GTGACTTTCT GCACCCGATA TGCGAACTGG TGCAGCGGCG CAGCCAAACG 
TTGGTGGAGC TGGCGGCCGG CGCCAGTGCC TTCACCGCCG AGCACTTCTA G

Protein sequence

MSGSEDNVYR LRVTHDGGTP VGELAYSRAE DRWSFRYDHA WARQGAFQLS PAFPLEPPPD 
GYDSHAIRRF IVNLFPEGAP LRAALEQLHV APSNAFALLR EMGGETTGAL EFQPFDQPPA 
AAARREQRFL SREELSGRID AAKEGGLTVW DGRVRMSIAG YQDKLAVWAA HDLVHDTEAS 
MWLPEPPLAS TFILKPQPAG PRTPHLVANE HYCMTLAGAY GAQVARVAIM RLRVPVLVVA 
RFDRQWRAEE NHDWVTKLHV IDACQAADLS VDSKYERHLG NSPALAPYRD GMSLPRLFGL 
AALMRRPAVA RLEMLRWALF QLAVGNSDAH GKNFSFFVDR TMLEPAPWYD VVSVAQYPEL 
DQSFAMSFGD AFGWEELNAM ELAHFAHLCG IDQKLLHRET ERLSRAMKRA PELLSAPVYT 
EEERDFLHPI CELVQRRSQT LVELAAGASA FTAEHF