Gene Vapar_3781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_3781
Symbol
ID	7970941
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	3998428
End bp	3999477
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	66%
IMG OID	644794368
Product	pentapeptide repeat protein
Protein accession	YP_002945663
Protein GI	239816753
COG category	[S] Function unknown
COG ID	[COG1357] Uncharacterized low-complexity proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCGCG ATGAACTCGT CGACAGGATC CGCCATGGCA CCCAGGTGGG CAACGCCGAT 
TGCAGGGGGT GGGACTTGAG CGGCCTCGAC CTCTCCGGCG CGATGATGGA CGACGTCGAT 
TTCAGCGGCG CGAACCTCGC CCGGGCCAAT CTCGAAGGCA GCTCGCTGTC GCACTGCAAG 
CTTTCAGGCT GCGACTTTTC CTTCGCCCAG TTGAAAGAGG CGCAGTTCTT TCGCAGCCGC 
ATGGAGGCGG CGCGGTTCGA TGCCGCCACG CTGGAAGGCG CCTCCTTCGT CGAGTGCCAC 
GCGGCGCGGG CGAGCTTCGC GCAGGCCAGG CTCGATCTCA CCAAGTTCTT TCGCTGCGAG 
CTCACGCAAA GCCGCTTGCA GTCGCGGCAG TTCGAGCGCG CGAGCTTCAT GGAATCGCAG 
CTCGACCGGG CCGATTTCAC CGGCGCGGCG CTGGGCCACG TGACCTTCTA CCGCCTCGAC 
CTGAAGACGG CGATTTTCCA GGGTGCATCC GGCCTCAACG CAATGTTCCT GGAGTGCGAC 
CTGAGCGGCC AGCGCTTCGC GGGCCTCTCG CTGTGCATGT GCCAGTTCAC GGACAGCCGC 
CTGGACGATG CCGACTTCAG CGGCGCCACG CTCACCCAAG CCAACTTCAA GGGCACCACG 
CTGAAGCACG CGGACTTCTC GAAAGCGGAC GCATGCCAGG CGCTGTTCCC GGAAGCCGAC 
CTCAGCGATG CGAACTGCAG CGGCGGGCGC TTCGACCAGT CGATCTGGGC CGAGGCCCTG 
CTGGAACGCG CCGACTTCTC GCAAGCCCGC ATGCCGCTCG GCGTGTTTCA CCACGCGCGC 
TGCGCCGGCG CGAACTTCCG CAACGCCGAC ATGCAGGACG CCGATCTTTC ATATGCCGAC 
CTGACCGGTG CCGACCTGGG CGGTGCTCAC TTCCTTCGCA CGCGCCTGCA CCGCGCCCAG 
CAGCAGGGCG CGCGGTTTTC CAGCCGCAAC GGAATCATCG ACAACGAGCC CGAGCTCTTC 
AAGGCACAGG CATGGTCCGA CTCGCACTGA

Protein sequence

MTRDELVDRI RHGTQVGNAD CRGWDLSGLD LSGAMMDDVD FSGANLARAN LEGSSLSHCK 
LSGCDFSFAQ LKEAQFFRSR MEAARFDAAT LEGASFVECH AARASFAQAR LDLTKFFRCE 
LTQSRLQSRQ FERASFMESQ LDRADFTGAA LGHVTFYRLD LKTAIFQGAS GLNAMFLECD 
LSGQRFAGLS LCMCQFTDSR LDDADFSGAT LTQANFKGTT LKHADFSKAD ACQALFPEAD 
LSDANCSGGR FDQSIWAEAL LERADFSQAR MPLGVFHHAR CAGANFRNAD MQDADLSYAD 
LTGADLGGAH FLRTRLHRAQ QQGARFSSRN GIIDNEPELF KAQAWSDSH