Gene Vapar_3863 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Vapar_3863
Symbol
ID	7969720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Variovorax paradoxus S110
Kingdom	Bacteria
Replicon accession	NC_012791
Strand	+
Start bp	4091771
End bp	4093090
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	62%
IMG OID	644794449
Product	Sel1 domain protein repeat-containing protein
Protein accession	YP_002945743
Protein GI	239816833
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.986909
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGGACA GCAAGCTGCC GCGCTTCACG AGGCTCGACA AGTTCGATCC GCACCGGAAG 
GACTTCGTGT GCAAGCATGA GGCCGAAGCC AACCCGCCCA TCACGGCAGA AGCCGAAGCA 
CTGTTCCAGC AGGCGCTGGC GCTGGTGAGC TACGAGATGT GGTCGGAGAA TCGCAACTAC 
GCCAGGGCGG CACAGCTGTA CGAGCAGGCA ATGAAGCTGG GCCACTGGAA GGCGCAGTTC 
AACCTGGCGG GGCTGTATCT GCAAGGTCTA GGCATCGAGC AAGACTCCGA GAAAGCCATC 
GAGTTGACCG AAGACTTGAT GCGCAAGGGC GTGCCCGCGG CCTGGGACAA CATGGGCACG 
ATGTACATGG GCGGCATTGG GTCGCTCAAG CAGGATGCGA CCGTGGCGTA CGCGTTCTGG 
CAGAAGGCTG CAGACATGGG GAGCATGGCA TCGCAGGCGT ACATCGGAGC CAAGTTGAAG 
GCCACGCACG ACGAACCACC GACCTTCTGG GGAAATCGCC TTGTCGGGTT GAAGATGCTT 
GAATGCGCGT TCGCCCAAGG CTCTGCGAAG GGCGCCTATG AATTGGCGAT CACACTCGTG 
GGCAACAATC CCGCGCTTCA AGAGAATGAC GAGCGGGCAC TCAGAGTCTT TCACGAAGGT 
GTCAAGCTTG GCAGTCAACA AAGCGCTGGC TATTTGAGTT CTTCATTTCG ACACGGAGAA 
AAGCCCGTAC AAGGAGGTCC GGATACATCA AGGGCTGATC GCTACCACGC TCTTGCCAAC 
GCGCTTTACT ACAACCCCGA CCTGCGCTTC CCCAACCTCG ACAAGGTGCT TCCCCTTCCC 
CCGGCACAGT TGCCCCAGTG GGACATGAGC GCCCCCAAGA CGCTCATCGA TGCCGCCAAG 
GCGGTGGTGC CGCCTGCCTC TTCGCCACCG CAGCAAGCAC CGGCATCAAC ATCCCAACGC 
ACCAGTCAGT TCGAAAGCGC CGAGCGAGGC ATGCTGGCCA CTCACACGCG CGTGGCCCAG 
GGCATCGCAC GAGAAGCCGA CTTGCCGAAA CCACTGGTTC GATGCAGCGG CGCCGGGCGC 
TGCCTTGTCA CGGGCATCTG GCAGGCACGC GTGCCCGACG ACCACGCGCT CGCCGCATCG 
TTCAACCAGT GGCATCGCCA GTCCTATGTG ATGGAGGGCC AGCCCTTCCC CGATCCGCGC 
GAACAGCACC TGGACATCGA TCCGGCGCAG GTCATTTGGA CCTGGTGGAA CCAGGCCAAC 
CATCTGGGCT TCGCCAGGAT TCCGCAGGTC AGCGTGGGCA ATCCGCCCGT CGCGGGGTAA

Protein sequence

MSDSKLPRFT RLDKFDPHRK DFVCKHEAEA NPPITAEAEA LFQQALALVS YEMWSENRNY 
ARAAQLYEQA MKLGHWKAQF NLAGLYLQGL GIEQDSEKAI ELTEDLMRKG VPAAWDNMGT 
MYMGGIGSLK QDATVAYAFW QKAADMGSMA SQAYIGAKLK ATHDEPPTFW GNRLVGLKML 
ECAFAQGSAK GAYELAITLV GNNPALQEND ERALRVFHEG VKLGSQQSAG YLSSSFRHGE 
KPVQGGPDTS RADRYHALAN ALYYNPDLRF PNLDKVLPLP PAQLPQWDMS APKTLIDAAK 
AVVPPASSPP QQAPASTSQR TSQFESAERG MLATHTRVAQ GIAREADLPK PLVRCSGAGR 
CLVTGIWQAR VPDDHALAAS FNQWHRQSYV MEGQPFPDPR EQHLDIDPAQ VIWTWWNQAN 
HLGFARIPQV SVGNPPVAG